Sprachliche Analyse

Sprachliche Analyse#

Die sprachliche Analyse der Invektive In Ciceronem erfolgt mithilfe eines Tools, das in dem Vorgängerprojekt Callidus (Computer-Aided Language Learning: Lexikonerwerb im Lateinunterricht durch korpusgestützte Methoden, DFG, Projektnummer: 316618374, 2017-2020) entwickelt wurde und seitdem kontinuierlich gepflegt wird.

Machina Callida#

Die Machina Callida unterstützt die automatische Erstellung von intralingualen Wortschatzübungen, die Berechnung der Textkomplexität und den Abgleich eines ausgewählten Textes mit verschiedenen Referenzkorpora zur Bestimung der Textabdeckung, d.h. Anteil der Wörter im Text, die in einem Grundwortschatz der z. B. 500 häufigsten Wörter vorkommen. Außerdem bietet sie eine Übungsdatenbank, Übungssequenzen der Universität Potsdam und eine beispielhafte Übungseinheit mit kuratierten Übungen für einen Lern- und Testmodus.

Link: Machina Callida

Zenodo: Callidus Project

Textkomplexität#

Für Textkomplexität gibt es verschiedene Definitionen, u.a. kann sie als Summe der Teilaspekte Leserlichkeit, Lesbarkeit und Verständlichkeit verstanden werden (cf. Beyer 2018, 197 ff.[1]).

  1. Leserlichkeit: Unter Leserlichkeit (lettering, legibility) versteht man äußere Merkmale eines Textes, die die Lesegeschwindigkeit beeinflussen. In diesem Sinn kann Leserlichkeit als das Maß für die Lesegeschwindigkeit bezeichnet werden.

  2. Lesbarkeit (readability) kann man als das zentrale Maß der Textkomplexität bezeichnen, da mit ihr die oberflächlichen Textmerkmale quantitativ gemessen werden können. Zu diesen Merkmalen gehören vor allem die sprachlichen Komponenten Wortlänge, (Teil-)Satzlänge, Textlänge und Wortfrequenz, die die Grundlage für weitere Berechnungen, wie beispielsweise die durchschnittliche Satzlänge oder die lexikalische Dichte, bieten.

  3. Die Textverständlichkeit ist generell als ein individuelles Maß zu verstehen, wie gut jemand einen Text lesen und vor allem verstehen kann. Neben den äußeren Merkmalen und der Oberflächenstruktur der Texte erfasst eine Verständlichkeitsmessung vor allem den Inhalt und die sprachlichen Kohärenzmerkmale, die sog. Tiefenstruktur eines Textes.

Die in der Machina Callida verwendeten Maße gehören zur Lesbarkeit und bieten damit ein Verfahrung zur Bestimmung der Lesbarkeit. Textkomplexität wird hier also mit Lesbarkeit gleichgesetzt, da die beiden anderen Komponenten nicht sinnvoll berücksichtig werden können: Die Leserlichkeit ist Software bedingt stets gleich, die Verständlichkeit geht vom Subjekt aus, das bei dieser Form der Datenauswertung nicht berücksichtigt werden kann.

Ergebnis der MC für die Textkomplexität der Invektive In Ciceronem:

  • Gesamtschwierigkeit: 41.39

  • Anzahl der Wörter: 720

  • Anzahl der Sätze: 37

  • Wörter pro Satz (Ø): 19.46

  • Wortlänge (Ø): 4.74

  • Anzahl verschiedener Wortformen: 500

  • Anzahl verschiedener Wortarten: 13

  • Lexikalische Dichte: 0.6

  • Anzahl der Satzzeichen: 168

  • Anzahl der Hauptsätze: 37

  • Anzahl der Nebensätze: 83

  • Anzahl der Infinitivkonstruktionen: 1

  • Anzahl der Partizipien: 31

  • Anzahl der Gerundien: 2

  • Anzahl der Ablativi Absoluti: 4

Das Gesamtmaß berücksichtigt alle hier gezeigten Einzelwerte gleichermaßen. Die lexikalische Dichte berechnet sich aus dem Verhältnis der Anzahl der differenten Inhaltswörter (z.B. rex) zur Gesamtlänge des Textes.