… von Lücken#

Historiographische Lücken#

In der antiken Geschichtsschreibung variieren je nach Autor und Werk die Darstellungen von ein- und demselben Ereignis. Ein entscheidendes Charakteristikum jeder Darstellung ist dabei die Selektion, die ein Autor vornehmen muss.

Bestimmte Informationen, Handlungszusammenhänge und Motive werden in den Text aufgenommen, andere nicht. Ziel ist in der römischen Geschichtsschreibung eine konsistente Darstellung der Geschichte, die jedoch aus unserer heutigen Sicht parteiisch ist.

Vergleicht man mehrere Versionen eines Ereignisses in verschiedenen antiken Texten, so lässt sich auch feststellen, welche spezifischen Informationen von Autoren nicht in ihre Texte aufgenommen wurden. Dieses Fehlen hat oft strategisch-literarische Gründe.

Bei der systematischen Untersuchung solcher Lücken sollen nun digitale Methoden helfen.

Forschungsfrage:

Wie lässt sich das Fehlen einer Information in einem Werk der antiken Geschichtsschreibung feststellen und deuten?

In einem Forschungstandem mit dem NLP-Experten Konstantin Schulz aus dem Daidalos-Team untersucht eine Professorin der Klassischen Philologie diese Frage aus literaturwissenschaftlicher Perspektive.

Zur Untersuchung der Frage am Beispiel der Konferenz von Luca (56 v. Chr.) kommt eine innovative Mischung aus Methoden des Natural Language Processing (NLP) zum Einsatz.

Zunächst wird mit Named Entity Recognition (NER) eine systematische Identifikation von Textstellen vorgenommen, die die Konferenz von Luca erwähnen, und von solchen, die sie erwähnen sollten, es aber nicht tun. Die Texte werden anschließend mithilfe einer Sentimentanalyse auf die darin transportierten Emotionen, Stimmungen und Haltungen untersucht, um herauszufinden, wie die Auslassungen und das Narrativ zueinander in Beziehung stehen.


Informationen zum Textkorpus:#

  • Sprachen: Griechisch; Latein

  • Zeitraum: 1. Jh. v. Chr. - 3. Jh. n. Chr.

  • Textarten: Geschichtsschreibung, Biographie, Briefe

  • Autoren: Cassius Dio, Cicero, Plutarch, Velleius Paterculus, Sueton, Appian

  • Weitere Schlüsselworte: römische Geschichtsschreibung, Historiographie, Epistolographie, (erstes) Triumvirat, Konferenz von Luca, narratologische Lücken, Auslassungen, Caesar, Pompeius, Crassus


Aufbau des Textkorpus:#

  • Untersuchungskorpus: Texte ohne Erwähnung der Konferenz von Luca:

    • Cassius Dio, Römische Geschichte 39,24-36

  • Vergleichskorpus: Texte, die Konferenz von Luca erwähnen („Referenznarrative“):

    • Cic. fam. 1,9,8-9

    • Suet. Iul. 24,1

    • Plut. Caes. 21

    • Plut. Pomp. 51

    • Plut. Crass. 14-15

    • Plut. Cat. min. 41,1-2

    • App. civ. 2,17

    • Vell. 2,46,1-2

  • Erweitertes Textkorpus:

    • Cass. Dio 37; 41

    • App. civ. 2

    • Caes. civ. 2


Methodenauswahl, Arbeitsschritte und Hindernisse:#

Vorüberlegungen:

Die Arbeitshypothese für diese Untersuchung ist, dass bestimmte historiographische Lücken nicht aufgrund von Quellenproblemen auftreten, sondern eine literarische Funktion erfüllen. Daher stellt sich zu Beginn der Zusammenarbeit die Frage, wie sich solche Lücken in historiographischen Texten überhaupt methodisch finden lassen.

Dementsprechend braucht es ein konkretes Fallbeispiel: Cassius Dio, der im 3. Jh. n. Chr. seine Römischen Geschichte schreibt, erwähnt die Konferenz von Luca nicht. Da andere Autoren wie Cicero und Sueton (s. o., Referenznarrative), auf die Cassius Dio sicherlich Zugriff hatte, diese aber auf unterschiedliche Weise thematisieren, ist die Konferenz von Luca ein geeigneter Untersuchungsgegenstand für dieses Forschungstandem.

Zum Vergleich dienen also Texte von Autoren, die die Konferenz von Luca ausdrücklich erwähnen: Caesar, Pompeius und Crassus kommen zusammen, um sich auf eine gemeinsame Politik zu einigen. Um mit dem Konzept „Lücke“ weiterarbeiten zu können, braucht es eine präzise Beschreibung, worum es sich im literaturwissenschaftlichen Sinn genau handelt.

  1. Was ist eine „Lücke“?

Den Begriff „Lücke“ verwenden wir für das Fehlen der deutlichen Nennung der Konferenz von Luca bei Cassius Dio. Gemeint ist damit das auffällige Fehlen einer Information in einem Text. Die Auffälligkeit ergibt sich durch den Vergleich mit Paralleltexten, die denselben (historischen) Sachverhalt (hier dieselbe Zeit und dieselben Ereignisse) schildern. Die Referenznarrative der Paralleltexte lenken Aufmerksamkeit auf die Fehlstelle in einem anderen Text.

  1. Wann wird eine „Lücke“ bedeutungsvoll?

Bedeutungsvoll wird die “Lücke”, wenn Indizien im Text selbst darauf hinweisen, dass die Auslassung mit der (literarischen) Wirkung des Textes zusammenhängt, z. B. durch das entwickelte Narrativ nötig ist.

Methoden:

Visualisierung der Named Entities in Farben

Abbildung 1: Visualisierung der Named Entities im Text mit dem Daidalos-Tool an einem Textbeispiel von Appian.

Um zu erfassen, wie die Konferenz von Luca bei den Autoren beschrieben wird, die sie explizit erwähnen, kommt im ersten Schritt NER zum Einsatz.

Trefferliste nach Textstellen mit Angabe 'gefunden durch Luca', 'gefunden durch Personennamen', 'falscher Treffer'

Abbildung 2: Die Beschreibungen der Konferenz von Luca werden bis auf einen falsch positiven Treffer zuverlässig gefunden.

Im nächsten Schritt soll eine Sentimentanalyse helfen, folgende Fragen zu beantworten:

  • Spiegelt sich bei Cassius Dio die schon früh negative Beziehung zwischen Pompeius und Caesar, die die „Lücke“ von Luca begründet, in den Emotionen bzw. Stimmungen, die der Text ausdrückt?

  • Lässt sich ein Verhältnis zwischen der „Lücke“ und den dargestellten Emotionen bzw. Stimmungen in den Texten nachweisen?

Visualisierung der Sentimentwerte in Farben

Abbildung 3: Cassius Dio, Beginn; farbliche Darstellung der Sentimentwerte.

Bedeutung der Farben für den Sentimentwert:

Farbe

Score

Bedeutung

grün

+1

positiv

hellgrün

+0.5

eher positiv

grau

0

neutral

hellrot

-0.5

eher negativ

rot

-1

negativ

weiß

Wort nicht im Sentimentlexikon, keine Zuordnung

Herausforderungen:

Für Latein wird das Sentimentlexikon LatinAffectus verwendet. Für das Altgriechische gibt es aktuell jedoch kein wissenschaftlich geprüftes Sentimentlexikon. Damit das Forschungstandem nicht an dieser Stelle zum Erliegen kommt, bietet ein experimenteller Einsatz eines großen Sprachmodells eine Chance.

Zusätzlicher Arbeitsschritt: Erstellung eines neuen Sentimentlexikons für Altgriechisch mithilfe von KI#

Eine genauere Beschreibung der Schritte, um dieses griechische Sentimentlexikon am Beispiel von LatinAffectus zu erstellen, ist hier nachzulesen.

Kurz zusammengefasst lief die Erstellung so ab: Aus der PROIEL Treebank kopiert Konstantin eine Liste von 9400 griechischen Lemmata. Er schreibt daraufhin einen Prompt für ein großes Sprachmodell (LLM), also eine Anweisung mit Kontext und Zielsetzung in natürlicher Sprache. Im Ergebnis soll der Output der Struktur des lateinischen Sentimentlexikons entsprechen und die Sentimentwerte der einzelnen Lemmata vergleichbar sein.

Dank dieser abgekürzten Vorgehensweise liegt also innerhalb kurzer Zeit eine Liste der Lemmata und ihrer zugehörigen Sentimentwerten vor. Etwas umständlich war lediglich die Portionierung der 9400 Lemmata in 1000er-Gruppen, um die „Aufmerksamkeitsspanne“ der KI nicht zu überstrapazieren. (Dabei handelt es sich um eine beabsichtigte technische Beschränkung der Rechenleistung.)

Nächste Iteration: Anpassung des Sentimentlexikons#

Die Professorin stellt als Fachexpertin bei der Durchsicht der Ergebnisse Mängel in der philologischen Genauigkeit fest. Noch bleiben kontextuelle Gegebenheiten wie Negationen außer Acht, was ein Problem für die Interpretation darstellt.

Auch generell müssen weitere Anpassungen vorgenommen werden, denn das lateinische Sentimentlexikon enthält ausschließlich Substantive und Adjektive. Zudem umfasst es – mit etwa 6000 – insgesamt weniger Lemmata als das neu erstellte Sentimentlexikon.

Wie sich zeigt, verwendet Cassius Dio mehr Verben als die anderen Autoren, was die Aussagekraft der ersten Ergebnisse reduziert. Das erkennt das Forscherduo an der Zahl der nicht analysierten Wörter: für 87 % kann kein Sentimentwert ermittelt werden.

Zur Erhöhung der Konsistenz entfernen sie noch alle Verben aus dem griechischen Sentimentlexikon. So passt sich die Anzahl der Lemmata an und die Analyseergebnisse der griechischen und lateinischen Texte lassen sich besser vergleichen.

Auch an diesem Punkt sind bei weitem nicht alle Herausforderungen beseitigt: Während in einer ersten Analyserunde die Berechnung des Sentimentwerts für Cassius Dio deutlich negativer ausgefallen war als bei den anderen Autoren des Korpus, landet er nach den Anpassungen des griechischen Sentimentlexikons lediglich im Mittelfeld. Für den Moment entfernt sich damit der Befund von der Ausgangshypothese, dass die Stimmung im Narrativ von Cassius Dio von Vornherein signifikant negativer ist als in den anderen Berichten.

Weiteres Vorgehen und nächste Schritte: Methoden kombinieren und weiterforschen#

Um die Untersuchung besser zu machen, muss das Forschungstandem im weiteren Vorgehen die verschiedenen Einflussfaktoren betrachten wie

  • Autor: Wie negativ schreibt Cassius Dio generell?

  • Sprache: Ist Altgriechisch generell positiver als Latein?

  • Genre: Ist Historiografie generell negativer als Biografie etc.?

Diese Fragen müssen geklärt werden, um die Ausgangshypothese substantiell beantworten zu können.

Für die Professorin steht fest: Das gemeinsame Forschen mit Daidalos eröffnet einerseits neue Perspektiven und liefert zum Teil unerwartete Ergebnisse. Andererseits darf bei einer komplexen Fragestellung nicht zu viel von einer einzelnen Methode erwartet werden. Im Falle ihres Forschungstandems ist der Einsatz einer Methode nur ein Teil der Lösung, für den es viel Vor- und Zuarbeit braucht.

Daher erweist sich Methodentriangulation als notwendig. Das bedeutet, dass verschiedene Methoden kombiniert werden müssen, um unterschiedlichen Schwierigkeiten zu begegnen, wie beispielsweise dem sprachlichen Umstand der Negationen bei Cassius Dio, die auf korrekte Weise in die Berechnung des Sentimentwerts einfließen sollen. Erst dann können Sentimentvergleiche mit den anderen Autoren an Aussagekraft gewinnen.

Hierfür wäre kontext-sensible Sentimentanalysen, etwa mit LLMs, ein vielversprechender Lösungsansatz, zumal Negationen ein generelles Problem für Sentimentlexika darstellen – nicht nur bei Cassius Dio.


Bleiben Sie dabei und verfolgen Sie, wie die Forschungstandems weitergehen.

Wir halten Sie hier und auf LinkedIn-Kanal über Fortschritte auf dem Laufenden.