# Datenbeschreibung

<!--
Leitfragen
- Auf welche Weise entstehen in Ihrem Projekt neue Daten?
- Werden existierende Daten wiederverwendet? (aus eigenen Projekten oder Projekten Dritter)
Wenn ja, welche Bedeutung haben die vorhandenen Daten für das Vorhabenziel? Warum sind
diese Daten wichtig?
- Wo wurde nach bereits existierenden Daten recherchiert (z. B. innerhalb der eigenen Institu-
tion, in fachspezifischen Repositorien und/oder Data Journals)?
- Welche Datentypen, im Sinne von Datenformaten (z. B. Bilddaten, Textdaten oder Messdaten) ent-
stehen in Ihrem Projekt und auf welche Weise werden sie weiterverarbeitet?
- In welchem Umfang fallen diese an bzw. welches Datenvolumen ist zu erwarten?
Weiterführende Informationen

IANUS. Forschungsdatenzentrum Archäologie & Altertumswissenschaften: Dateiformate. URL:
https://ianus-fdz.de/it-empfehlungen/dateiformate [26.07.2022].
forschungsdaten.info: Formate erhalten. Inhalte langfristig sichern. URL: https://www.for-
schungsdaten.info/themen/veroeffentlichen-und-archivieren/formate-erhalten/ [26.07.2022].
-->

## Nachnutzung von Daten

Die Basis des Forschungsvorhabens bildet die bisher nur im Bildformat digital vorliegende Handschrift _In Ciceronem_ aus dem Manuskript D'Orville 77, die sich im Besitz der University of Oxford befindet. Außerdem werden für die verschiedenen Methoden unterschiedliche KI-Modelle des NLP nachgenutzt.

Es werden folgende Daten und Datensätze nachgenutzt:

- Scan bzw. Fotos des Manuskripts D'Orville 77, Auszug _In Ciceronem_ (6621 x 7242 px) im PNG-Format, © Bodleian Libraries, University of Oxford, CC BY-NC 4.0
- ...


## Generierung von Daten

Es entstehen durch Digitalisierung, Anreicherung und Verarbeitung des digitalen Textes Daten. Dabei handelt es sich um folgende Daten und Datensätze:

- normalisiertes Digitalisat der Handschrift _In Ciceronem_ als txt-Format (Rohtext)
- diplomatischer Text handschriftlich, Format: PNG, Ablage: ... 
- manuelle Annotationen für den Vergleich mit Ergebnissen der automatischen Analyse, Format: Excel
- Jupyter Notebooks für die Einbettung von Code-Abschnitten in das Jupyter Book
- ...