Was sind Digital Humanities?

Die Digital Humanities oder e-Humanities (zu deutsch "Digitale Geisteswissenschaften") sind, genau wie die Computerlinguistik, eine recht junge Disziplin und ebenfalls an der Schnittstelle zwischen Geistes- und Informatikwissenschaften angesiedelt. Allerdings liegt der Fokus nicht ausschließlich auf den Philologien (Sprach- und Literaturwissenschaften), sondern auf Geistes- und Kulturwissenschaften im Allgemeinen. Im Zuge der voranschreitenden Digitalisierung geistes- und kulturwissenschaftlicher Daten, sowohl durch Retrodigitalisierung als auch die Zunahme von born digital-Daten, haben die Digital Humanities in den letzten Jahren mehr und mehr an Bedeutung gewonnen. Wichtige Aufgabenbereich des Fachs sind dabei:

  1. Digitalisierung: Textuelle Daten können mithilfe von Verfahren der Optical Character Recognition (OCR) digitalisiert und 'computerlesbar' gemacht werden. Dies funktioniert aber nur bei gedruckten Texten, guter Druckqualität der Vorlage und moderner Sprache relativ gut. Schlechte Druckqualität (z.B. vergilbte oder unvollständige Seiten) und alte oder schwer lesbare Schriften (z.B. Handschrift, enge Fraktur oder nicht-lateinische Alphabete) haben zur Folge, dass Buchstaben und Satzzeichen nicht mehr gut erkannt werden. Zudem passen statistische Modelle wahrscheinlicher und unwahrscheinlicher Buchstabenabfolgen nicht mehr gut, wenn sie auf ältere Sprachstufen ohne normierte Rechtschreibung angewendet werden. Handgeschriebene Texte lassen sich schließlich überhaupt nur sehr eingeschränkt mit OCR-Verfahren digitalisieren und müssen von Hand transkribiert (Double Keying-Verfahren) oder mit neueren Handwritten Text Recognition-Verfahren bearbeitet werden. Auch bei multimodalen Daten, z.B. archäologischen Artefakten, Gemälden, oder alten Ton- oder Videoaufnahmen ist die Digitalisierung nicht immer trivial.
    Beispiele in diesem Bereich sind die Projekte Digitalisierung von Werken der historischen Projektionskunst, eine Kollaboration zwischen den Medienwissenschaften und dem Kompetenzzentrum für elektronische Erschließungs- und Publikationsverfahren in den Geisteswissenschaften (Trier Center for Digital Humanities), und das Virtuelle Skriptorium St. Matthias inklusive des Anschlussprojekts eCodicology.

  2. Archivierung: Während nicht-digitale geisteswissenschaftliche Daten wie Steintafeln, aber auch Papyri und alte Manuskripte relativ einfach archivierbar und unter günstigen Bedingungen lange haltbar sind, ist die Langzeitarchivierung bei digitalen Daten immer noch eine große Herausforderung. Ein Problem ist die relativ schnelle Materialermüdung vieler digitaler Datenträger, ein anderes die ständige Weiterentwicklung in den Bereichen Software und Hardware. Es gibt nicht mehr viele Computer, die noch über ein Diskettenlaufwerk verfügen und vermutlich noch weniger, auf denen noch Software läuft, mit der sich eine Datei lesen läßt, die vor 20 Jahren mit einem zeitgenössischem Textverarbeitungsprogramm erstellt wurde. Folglich sind Fragen der Langzeitarchivierung und Langzeitverfügbarkeit derzeit intensiv diskutierte Probleme. Ein Trierer Lösungsansatz ist beispielsweise das Virtuelle Datenrepositorium.

  3. Repräsentation: Nachdem geisteswissenschaftliche Daten digitalisiert wurden, stellt sich die Frage, wie diese am besten repräsentiert und für Experten und/oder Laien zugänglich gemacht werden können. Dies schließt sowohl technische Aspekte ein, z.B. Zeichenkodierung, Wahl einer geeigneten Auszeichnungssprache oder einer performanten und reliablen Datenbank, als auch solche, die mehr im funktional-ästhetischen Bereich liegen. Typische Anwendungsbeispiele reichen von der Erstellung einer digitalen Edition eines literarischen Werks über die Umsetzung einer kulturhistorischen, multimedialen Datenbank bis hin zur Entwicklung digitaler Forschungsdatenbanken. Beispielprojekte, die mit Beteiligung des Kompetenzzentrum für elektronische Erschließungs- und Publikationsverfahren in den Geisteswissenschaften (Trier Center for Digital Humanities) umgesetzt wurden, sind das Portal Europäische Geschichte Online oder das Heinrich-Heine-Portal.

  4. Visualisierung: Dem Bereich Visualisierung kommt eine wichtige Position zwischen Datenrepräsentation und -analyse zu. Darunter fällt zum Beispiel die Frage, wie komplexe geisteswissenschaftliche Daten so dargestellt werden können, dass sie für Fachwissenschaftler (und/oder ggf. Laien) besonders gut zugänglich sind. Damit verbunden ist die Möglichkeit, durch geeignete visuelle Aufbereitung eine zusätzliche Explorationskomponente zu schaffen. Ein Beispiel ist das Projekt Der Digitale Peters, in dem die Synchronoptische Weltgeschichte von Arno Peters digital aufbereitet wurde. Das digitale Medium bietet dabei den Vorteil, dass historische Ereignisse und deren Zusammenhang auch graphisch dargestellt und miteinander verlinkt werden können. Ein anderes Beispiel ist das Projekt Vernetzte Korrespondenzen, in dem soziale, räumliche, zeitliche und thematische Netze in Briefkorpora visualisiert werden.

  5. Analyse: Digitale Daten haben den Vorteil, dass sie (theoretisch) nicht nur einfacher zugänglich sind als nicht-digitale Daten, sondern dass sie zudem die Möglichkeit einer (teil-)automatischen Analyse und Auswertung bieten. Dadurch lassen sich oft, in Zusammenarbeit mit geisteswissenschaftlichen Fachwissenschaftlern, Informationen gewinnen, die sich auf traditionellen Weg nur mit sehr großem Aufwand gewinnen lassen würden. Hier spielen besonders Methoden des Text Minings eine große Rolle, mit deren Hilfe ausgewertet und Trends und Interdependenzen erkannt werden können. Trierer Beispiele sind das Projekt SeNeReko, in dem altägyptische und altindische Texte automatisch semantisch analysiert werden, um neue Erkenntnisse über Religionskontakte zwischen beiden Kulturen zu gewinnen. Ein anderes Projekt, Asymetrical Encounters, hat zum Ziel, Text Mining-Verfahren auf historische Zeitungskorpora anzuwenden, um etwas darüber zu erfahren, wie sich unterschiedliche Nationalkulturen gegenseitig kulturell beeinflusst haben. Zur automatischen Analyse gehören aber auch, zum Beispiel, die Entzifferung unbekannter Schriften oder verschlüsselter historischer Dokumente sowie die automatische Auswertung von Twitter-Daten, um z.B. etwas über die Verbreitung linguistischer Neuschöpfungen oder Themenkonjunkturen zu erfahren.