Die Mehler’sche Dissertation

Textbedeutungen. Zur prozeduralen Analyse und Repräsentation struktureller Ähnlichkeiten von Texten

beschäftigt sich mit grundlegenden Bedingungen der Realisierung selbst-lernender, maschineller Verarbeitung natürlichsprachlicher Texte, deren Bedeutungen nicht anhand ihres vorgängigen Verständnisses zu repräsentieren sind, sondern als Resultate semiotischer Prozesse analysiert werden können, durch die sich die Struktur dieser Texte wie das Verstehen ihrer Bedeutungen konstituieren. Dabei handelt es sich um Prozesse, durch die (mehr oder weniger) bestimmte Agglomerationen von Entitäten in (mehr oder weniger) bestimmten Zusammenhängen (mehr oder weniger) bestimmte Eigenschaften zukommen, und deren mehrstufige Zusammengesetztheit unter anderem als die Bedeutung von Zeichen verstanden wird.

In der vorliegenden Arbeit geht es um die Rekonstruktion derartiger Prozesse als Prozeduren, und wie sie im Rahmen eines korpusanalytischen Ansatzes sowohl empirisch-quantitativ wie formal-algebraisch fundiert, algorithmisch modelliert und aufgrund der Dynamik ihrer Resultate adäquat repräsentiert werden können. Der Autor bewältigt diese Aufgabenstellung mit Bravour, durch ungewöhnlichen Ideenreichtum, klare Argumentation und (bisweilen formale) Beweisführung seiner begrifflich scharfen, definitorisch sauberen und prozedural überprüften Neuentwicklungen. Gedankliche Disziplin und wissenschaftliche Anspruch dieser (sehr umfangreichen) Dissertation entschädigen dabei für den dem Leser abverlangten Verstehensaufwand durch z.T. brillante Vermittlung überraschender Zusammenhänge und neuer Einsichten.

Grundlage und Ausgangsbasis der Problemstellung dieser Dissertation bilden Hypothesen u.a. der Unscharfen Semantik (Rieger 1989),  wonach die strukturelle Bedeutung sprachlicher Zeichen als zweistufiger Prozeß ihrer (syntagmatischen) Kookkurrenzen und (paradigmatischen) Vergleichskontexte rekonstruierbar ist. Auf der Basis der so algorithmisierten Regularitäten der Wortgebräuche gelingt dem Autor eine in jeder Hinsicht beeindruckende Verallgemeinerung dieses Ansatzes, die er sowohl formal (graphentheoretisch und relationenalgebraisch) als auch empirisch (mathematisch-statistisch) und prozedural (algorithmisch) als wohlbegründet einführen und nachweisen kann.  Durch die methodische Entwicklung neuer Verfahren zur Analyse von Textkorpora, in deren Verlauf die Emergenz semantischer Ähnlichkeiten von Texten zur Konstitution individueller Textbedeutungen führen, kann Mehler diese Textbedeutungen als Vektoren (Distributionen von Werten von Textkonstituenten) adäquat darstellen und im semantischen Raum vereinheitlichend als Textbedeutungspunkte repräsentieren. Gleichzeitig stellt der Autor mit der simulativen Nachbildung dieser Prozesse der Bedeutungskonstitution von Texten im Rechner eine von ihm entwickelte, textlinguistisch motivierte und voll-automa­tische Methode zur semantischen Gruppierung von Texte bereit. Diese Prozeßsimulation arbeitet auch dann erfolgreich, wenn die verarbeiteten Texte nur wenige – oder sogar keine – oberflächenstrukturelle  Gemeinsamkeiten aufweisen, wohl aber semantisch ähnliche Inhalte behandeln. Mehlers computersemiotische Ausarbeitung dieses innovativen Verfahrens zur automatischen Erstellung von Verweis­struk­turen (Hypertexte) in pragmatisch homogenen Textsammlungen kann angesichts des weltweiten Mangels auch nur vergleichbarer Verfahren höchste Aktualität bescheinigt und beträchtliche Beachtung vorausgesagt werden.