Mining and Modeling Text

Interdisziplinäre Anwendungen, informatische Weiterentwicklung, rechtliche Perspektiven

Durch die Digitalisierung werden zunehmend umfangreiche Text- und Datenbestände verfügbar. Der Verbund stellt sich der Herausforderung, dass es für deren effiziente Nutzung in den Geisteswissenschaften notwendig ist, innovative Verfahren zu entwickeln, welche die automatische Informationsextraktion erlauben und die darauf aufbauende Wissensgenerierung befördern.

 

Das Vorhaben befasst sich vor diesem Hintergrund mit der automatischen Extraktion, Strukturierung und Vernetzung von Fachinformationen aus Text- und Datensammlungen sowie mit der Nutzung solcher Informationsnetzwerke für die Beantwortung geisteswissenschaftlicher Fragestellungen. Erster Anwendungskontext ist die deutsche und französische Literaturgeschichte, die Übertragbarkeit der Verfahren auf andere Disziplinen wird aber von Anfang an mitgedacht. Das Vorhaben berücksichtigt dabei unterschiedliche Arten von Texten: von leicht strukturierten Texten (bspw. bibliografische Verzeichnisse) über geisteswissenschaftliche Sachtexte (bspw. literaturgeschichtliche Fachliteratur) bis hin zu literarischen Texten (bspw. Romane).

 

Kernanliegen ist es, interdisziplinäre Lösungsansätze zu entwickeln, wobei konzeptuelle, geisteswissenschaftliche, informatische, rechtliche und infrastrukturelle Fragestellungen und Verfahren ineinandergreifen.

 

Das IRDT steuert seine rechtliche Expertise an dem Projekt bei. Vom Institut an dem Projekt beteiligt sind Prof. Dr. Raue, Prof. Dr. von Ungern-Sternberg und Frau Erler.