… von Epitaphien#

Epitaphien in der Griechischen Literatur#

Kann eine semantische Analyse von πόλις, πρόγονοι und ἀρετή dabei helfen, die Trauerarbeit in drei ausgewählten Epitaphien besser zu verstehen? Dieses Daidalos-Forschungstandem vergleicht mithilfe von Natural Language Processing (NLP) die drei Totenreden sowohl untereinander als auch mit dem restlichen Korpus von Thukydides, Lysias und Platon. Damit trägt dieses Forschungsprojekt dazu bei, philologische und historische Fragestellungen aus einem neuen Blickwinkel zu beantworten.

Forschungsfrage:

Welche stilistischen und inhaltlichen Unterschiede gibt es zwischen den Epitaphien des Thukydides, Lysias und Platon, sowohl untereinander als auch im Vergleich zu ihren anderen Werken?

In einem Forschungstandem mit dem NLP-Experten Konstantin Schulz aus dem Daidalos-Team untersucht Joshua Burgert diese Frage aus klassisch-philologischer Perspektive.

Die Untersuchung wird durch die NLP-Methode Word Embeddings unterstützt und vertieft, indem für eine Auswahl von Zielwörtern (πόλις, πρόγονοι und ἀρετή) jeweils der semantische Kontext ermittelt wird. Ergänzt wird das Vorgehen durch eine Kookurrenzanalyse. Die Ergebnisse werden graphisch in Form von Plots dargestellt.


Informationen zum Textkorpus:#

  • Sprache: Altgriechisch

  • Zeit(raum): 5./4. Jahrhundert v. Chr. (präziser: Ende 5. / Anfang 4. Jh.)

  • Textarten: (attische) Epitaphien; Geschichtsschreibung, Gerichtsreden, philosophische Dialoge

  • Autoren: Thukydides, Lysias, Platon

  • Weitere Schlüsselworte: Athen, politische Rhetorik, epitaphios logos, Krieg, Trauer


Aufbau des Textkorpus:#

  • Untersuchungskorpus, Epitaphien:

    • Thukydides, Der Peloponnesische Krieg 2.35-2.46

      Totenrede des Perikles auf die Gefallenen des Kriegsjahres 431 v. Chr.

    • Platon, Menexenos

      Dialog zwischen Sokrates und Menexenos mit Totenrede des Sokrates auf die Gefallenen eines unklaren Krieges

    • Lysias, Or. 2

      Totenrede auf die Gefallenen des Korinthischen Krieges

  • Vergleichskorpus: alle übrigen Texte der drei Autoren


Methodenauswahl, Arbeitsschritte und Hindernisse:#

Nach einer Klärung der Ausgangslage verständigen sich die Tandempartner auf digitale Methoden der distributionellen Semantik. Sie folgen also der Annahme, dass sich die Bedeutung eines Wortes aus dem Kontext ergibt, in den es eingebettet ist.

Für diesen ersten Schritt stellt der klassische Philologe Joshua drei Begriffe als zentral heraus:

πόλις
Stadt
πρόγονοι
Vorfahren
ἀρετή
Tugend

Um deren jeweilige semantische Einbettung sichtbar zu machen, kommen zwei Verfahren zum Einsatz:

  • Kookkurrenzanalysen zeigen, mit welchen Wörtern die Zielbegriffe in den Originaltexten besonders häufig in einem definierten Kontext gemeinsam auftreten. Bsp.: ἡμέτεροι πρόγονοι

  • Word Embeddings ergänzen diese Perspektive durch die Modellierung semantischer Nähe auf Basis indirekter Textzusammenhänge in einem definierten Kontext.

Diese methodische Kombination erlaubt sowohl präzise Textarbeit als auch explorative Visualisierungen in Form semantischer Netzwerke.

Grafische Darstellung als Netzwerk zum Begriff progonos, πρόγονος (Plot)

Abbildung: Lysias, Epitaph; noch ohne die Verbindung ἡμέτεροι πρόγονοι.

Herausforderungen der Datenaufbereitung sind dem Forschungstandem dabei auch begegnet:
Beispielsweise hat sich herausgestellt, dass erwartete Wortverbindungen wie ἡμέτεροι πρόγονοι im automatisierten Kookkurrenznetz zunächst fehlten, obwohl sie im Text tatsächlich mehrfach vorkommen.

Wie kommt es dazu? Dieses Problem war für die beiden Forschenden erwartbar und sie hatten auch direkt eine Lösung parat: Um bei der Analyse für die Forschungsfrage irrelevante Begriffe wegzulassen, kommen sogenannte Stoppwortlisten zum Einsatz. Dabei handelt es sich um eine Liste von Wörtern, die bei der Analyse nicht berücksichtigt und damit auch nicht visualisiert werden. Häufige und nicht sinntragende Worte sind insbesondere Pronomen, Artikel, Präpositionen und Konjunktionen.

Daidalos nutzt bereits vorhandene Datensätze. Das bedeutet, dass auch hier auf eine schon erstellte Stoppwortliste zurückgegriffen wird. Da unter anderem Possessivpronomen auf der verwendeten Stoppwortliste gelistet sind, erklärt sich so das Fehlen der gesuchten Wortverbindung.

Die umfangreiche Stoppwortliste (hier einzusehen) hat das Forscherduo daher entsprechend angepasst und damit die Hürde beseitigt. Nun können sie sich weiteren Herausforderungen stellen…

Anmerkung: Zur Vereinfachung sprechen wir hier lediglich von Kookurrenznetzen. Die einzelnen Arbeitsschritte waren jedoch komplexer: Die Grundlage für die Netze bildeten hauptsächlich Word Embeddings, die durch Werte aus der Kookkurrenzberechnung verfeinert wurden.


Wie Joshua Burgert sein Tandem in verschiedenen Phasen beschreibt, können Sie hier nachlesen:

  • Unter diesem Zenodo-Link finden Sie eine Präsentation zu einem Zwischenstand des Projekts nach drei Iterationen.

  • Außerdem befindet sich ein ausführlicher Erfahrungsbericht über die Zusammenarbeit im Publikationsprozess, den wir hier nach der Veröffentlichung verlinken.

Übrigens: Auf unserem LinkedIn-Kanal finden Sie Neuigkeiten rund um das Projekt Daidalos und bald auch zu den Forschungstandems.