Mining and Modeling Text. Interdisziplinäre Anwendungen, informatische Weiterentwicklung, rechtliche Perspektiven (MiMoText)

Durch die Digitalisierung werden zunehmend umfangreiche Text- und Datenbestände verfügbar. Der Verbund stellt sich der Herausforderung, dass es für deren effiziente Nutzung in den Geisteswissenschaften notwendig ist, innovative Verfahren zu entwickeln, welche die automatische Informationsextraktion erlauben und die darauf aufbauende Wissensgenerierung befördern.

Das Vorhaben befasst sich vor diesem Hintergrund mit der automatischen Extraktion, Strukturierung und Vernetzung von Fachinformationen aus Text- und Datensammlungen sowie mit der Nutzung solcher Informationsnetzwerke für die Beantwortung geisteswissenschaftlicher Fragestellungen.

Kernanliegen ist es, interdisziplinäre Lösungsansätze zu entwickeln, wobei konzeptuelle, geisteswissenschaftliche, informatische, rechtliche und infrastrukturelle Fragestellungen und Verfahren ineinandergreifen.

Erster Anwendungskontext ist die deutsche und französische Literaturgeschichte, die Übertragbarkeit der Verfahren auf andere Disziplinen wird aber von Anfang an mitgedacht. Das Vorhaben berücksichtigt dabei unterschiedliche Arten von Texten: von leicht strukturierten Texten (bspw. bibliografische Verzeichnisse) über geisteswissenschaftliche Sachtexte (bspw. literaturgeschichtliche Fachliteratur) bis hin zu literarischen Texten (bspw. Romane).

Mit „MiMoText“ wird ein wegweisendes digitales Forschungsinformationsnetzwerk für die Geisteswissenschaften entwickelt, das einen wesentlichen Beitrag zum profilbildenden Forschungsschwerpunkt „Digitalisierung und Geisteswissenschaften / Digitalität“ der Universität Trier leistet.