Textminer

Ein Programm zur automatischen, inhaltsbasierten Konversion von Texten in Hypertexte für das Wissensmanagement in Intranets

Ein System zur inhaltsorientierten Analyse natürlichsprachlicher Texte und ihrer Verknüpfung zu Hypertexten wurde am Lehrstuhl für Linguistische Datenverarbeitung der Universität Trier (Prof. Dr. Burghard Rieger) entwickelt. Der Textminer ist ein Programm, das Dokumente in betrieblichen oder öffentlichen Organisationen inhaltlich verfügbar macht. Den Großteil dieser Dokumente bilden natürlichsprachliche Texte, die keine schematische Organisation aufweisen, wie sie etwa durch die Verwendung von Textbausteinen oder Formblättern zustande kommt. Aus der Sicht der Mitarbeiter einer Organisation ergibt sich durch den exponentiellen Zuwachs solcher Dokumente ein massives Informationsverarbeitungsproblem, das mit exemplarischen Fragestellungen folgender Art verknüpft ist: Welche Dokumente sind für welchen Mitarbeiter relevant? Wie findet ein Mitarbeiter Aufgaben-relevante Dokumente? Welche Dokumente wurden in welcher Hinsicht übersehen? Die Präsentation des Textminers stieß auf ein breites Interesse beim Messepublikum. In über 70 Einzelpräsentationen wurde die Funktionstüchtigkeit des Systems demonstriert. Zu den Interessenten zählten Vertreter aus Unternehmen, Banken, wissenschaftlichen Instituten sowie aus internationalen Verlagen.

 

Elektronisch gespeicherte Texte bilden eine zunehmend wichtigere Informationsstruktur zur Wissensvermittlung in Organisationen. Die adäquate Verfügbarmachung von Texten spielt eine entscheidende Rolle im Hinblick auf eine vollständige und zugleich effiziente Aufgabenbewältigung. Die Lösung dieser Anforderung verlangt wiederum eine inhaltliche Verarbeitung von Texten, die es erlaubt, den Zusammenhang von variierender Aufgabenstellung und Aufgaben-relevanten Dokumenten zu ermitteln. Der Textminer ist ein System, das sich der Lösung dieser Aufgabe widmet. Er erlaubt die automatische Analyse inhaltlicher Beziehungen von Texten (man spricht in diesem Zusammenhang auch vom sogenannten Textmining) und deren Explikation in Form von Textverknüpfungen (Links) in Hypertexten (als Bestandteile des Intranets). Je nach Aufgabenkontext ermöglicht der Textminer die Erzeugung verschiedener Hypertexte. Hierdurch wird es möglich, dieselbe Dokumentenmenge vor dem Hintergrund variierender Informationsbedürfnisse perspektivisch zu explorieren. Aufgabenkontexte werden durch bereits verfügbare oder Aufgaben-typische Dokumente identifiziert.

 

Technologisch betrachtet realisiert der Textminer eine Client-Server-Architektur, die auf einer relationalen Datenbank zur Verwaltung der im Rahmen des Textminings anfallenden Daten beruht. Der Textminer besitzt ein GUI, das heißt eine graphische Benutzerschnittstelle, zur Visualisierung von Dokumentenbeziehungen. Der Textminer wurde mit dem Ziel entwickelt, eine prototypische Entwicklungsumgebung für das Textmining bereitzustellen.

 

Die Präsentation des Textminers gab Anlass zur Verabredung und Konkretisierung vielfältiger Kooperationsvorhaben. Es wurden Treffen vereinbart, in denen sondiert werden soll, wie der Textminer zur inhaltsbasierten Verwaltung von Intranets in heterogenen Organisationen erweitert werden kann. Ferner wurde der Projektleiter des Textmining-Projekts, Alexander Mehler, zu einer Präsentation der Konzeption des Textminers auf dem Know Tech Congress 2000 – Virtual Enterprise & E-Business mit Knowledge Engineering & Knowledge Managementsystemen in Leipzig – eingeladen.

 

Weitere Information zum Textmining-Projekt in der Linguistischen Datenverarbeitung an der Universität Trier:

Alexander Mehler

Fachbereich II

Linguistische Datenverarbeitung

Universitätsring 15

54286 Trier

E-Mail: mehler@uni-trier.de