Das Ziel dieser Übung besteht darin, Sie mit den Werkzeugen und Konzepten vertraut zu machen, die es Ihnen ermöglichen, historisch fundierte Aussagen über mittelalterliche Handschriften und Gebetbücher durch die Auswertung von Daten, wie beispielsweise Erschließungsdaten, digitale Bilder oder weitere Verarbeitungsoutputs, zu formulieren. Sie werden mit echten Daten aus einem Forschungsprojekt über mittelalterliche Stundenbücher arbeiten und in aktuelle Forschungen eingebunden werden. Dabei werden Sie sowohl Einblicke in die Erforschung von Gebetbüchern, ihren materiellen (kodikologischen) Eigenschaften und der Verbreitung liturgischer Texte im Mittelalter erhalten als auch mit Fragen der künstlichen Intelligenz für die automatische Bildanalyse, Handschriftenerkennung, Katalogisierung und Problemen der Informationsmodellierung sowie der Auswertung von fehlerhaften und unsicheren Daten vertraut gemacht werden.
Die Daten stammen aus der Datenbank HORAE - Hours: Recognition, Analysis, Editions (https://heurist.huma-num.fr/heurist/?db=stutzmann_horae&website) und beschreiben etwa 9.000 Handschriften. Davon wurden 1.000 anhand von Digitalisaten analysiert.
Nach den grundlegenden Themen Modellierung und Datenqualitätsbewertung werden Sie in gängige Tools wie OpenRefine, Excel und Heurist eingeführt, um Metadaten zu bereinigen, zu formalisieren, zu klassifizieren, zu visualisieren und zu analysieren (z. B. Karten, Zeitstrahl, IIIF-Bildexzerpte). Sie werden auch dedizierte Tools für Text- und Bildanalyse kennenlernen und anwenden (wie Yolo, ocr4all, Transkribus).
Die Daten stammen aus der Datenbank HORAE - Hours: Recognition, Analysis, Editions (https://heurist.huma-num.fr/heurist/?db=stutzmann_horae&website) und beschreiben etwa 9.000 Handschriften. Davon wurden 1.000 anhand von Digitalisaten analysiert.
Nach den grundlegenden Themen Modellierung und Datenqualitätsbewertung werden Sie in gängige Tools wie OpenRefine, Excel und Heurist eingeführt, um Metadaten zu bereinigen, zu formalisieren, zu klassifizieren, zu visualisieren und zu analysieren (z. B. Karten, Zeitstrahl, IIIF-Bildexzerpte). Sie werden auch dedizierte Tools für Text- und Bildanalyse kennenlernen und anwenden (wie Yolo, ocr4all, Transkribus).
Auch wird auf einer grundlegenden Ebene in die Netzwerkanalyse mithilfe von Python-Bibliotheken eingeführt.
Bei allen behandelten Fragen und verwendeten Werkzeugen werden Sie
insbesondere die Unsicherheit der Daten untersuchen, den Unterschied
zwischen Korrelation und Kausalität verstehen und die Implementierung
und den Beitrag der Werkzeuge kritisch und reflektiert betrachten.
- Kursverantwortliche/r: Prof. Dr. Dominique Stutzmann
Semester: WiSe 2023/24