Burghard Rieger, Aachen

COLING 76: Concepts, Frames, and Scripts in Aid of Semantic Networks, Knowledge Systems, and Fantasies

(November 1976)

Dies hätte der Titel der 6. Tagung für Computational Linguistics sein können, die vom International Committee on Computational Linguistics (ICCL) während seines inzwischen 11-jährigen Bestehens diesmal in Ottawa, Kanada, vom 28. Juni bis 2. Juli 1976 veranstaltet wurde.
Daß wissenschaftliche Termini und Begriffe zuweilen Schibboleth-Charakter annehmen, ist eine ebenso bekannte wie wenig beachtete Erscheinung. Sie wird im allgemeinen, und meist auch zurecht, als eine der kurzlebigeren Begleiterscheinungen des Wissenschaftsbetriebs abgetan. Möglicherweise aber läßt sie sich auch als Hinweis auf längerfristige Vorgänge deuten, wenn man sie als Beleg etwa thematischer, methodischer oder auch theoretischer Um- oder Neuorientierungen wertet, wie sie sich gerade im Verlauf der Konsolidierung einer wissenschaftlichen Disziplin häufiger ergeben.
Im Rahmen des Natural Language Processing, dem es in den zehn Jahren nach dem ALPAC-Report gelungen ist, wesentliche Teile einer früheren Aufgabenstellung aus der maschinellen Übersetzung (MT) mit Hilfe des neuen Forschungsansatzes der künstlichen Intelligenz (AI) in die Computerlinguistik (CL) hinüberzuretten, scheinen gleich mehrere Begriffe dieses Phänomen zu belegen. Deren Wirksamkeit stützt sich dabei vorerst weniger auf hohe Abstraktheit oder begriffliche Strenge, sondern vornehmlich auf die Bereitschaft, mit der ihre Verwender die eigenen mehr oder weniger vagen Grundvorstellungen mit den nicht minder unscharfen Begriffsbildungen anderer identifizieren. Vertreter zunächst noch unterschiedlicher Forschungsansätze und Fachrichtungen gelangen so zunehmend zu der Einsicht, seit langem ganz ähnliche oder gleiche Gedanken und Vorstellungen entwickelt oder mit solchen gearbeitet zu haben, ohne sich dieser Nähe von Gegenstand, Methode oder Idee der eigenen Arbeiten zu denen anderer bewußt gewesen zu sein. Dabei steht schon jetzt der Einfluß und die Fruchtbarkeit des Neuansatzes außer Frage, der durch die AI auf dem Gebiet der Entwicklung von Modellen und Systemen zu Abbildung und Simulation von Verstehensprozessen initiiert wurde und etwa mit Begriffen wie concept, frame oder script verbunden ist.

As the basic atomic unit ... Concept is defined as representation of an object occupying space and/or time, of Attributes specifying what an object is or does, and of relation, between objects. The modular unit is a structure of concepts, a conceptualization that represents situations and relations between situations.1
A frame is a data-structure for representing a stereotype Situation ... Attached to each frame are several kinds of information. Some of this information is about how to use the frame. Some is about what one can expect to happen next. Some is about what to do if these expectations are not confirmed. We can think of a frame as a network of nodes and relations.2
A script is ... defined as a predetermined causal chain of conceptualizations that describe a normal sequence of things in a familiar situation.3

Die Gemeinsamkeiten in Problemstellung bzw. Forschungsansatz sind freilich noch kaum präzisiert, weder im Hinblick auf ihre begrifflichen Implikationen noch auf ihre theoretischen Grundlagen oder methodischen Konsequenzen, worauf etwa R. J. Brachman (What's in a Concept: Structural Foundation for Semantic Networks) hinzuweisen suchte. Soviel allerdings ist deutlich: die neuen Begriffe - nach innen vereinheitlichend, nach außen wie Erkennungs- und Markenzeichen wirkend - werden zu einer semantischen Umorientierung führen, die es erlaubt, Bedeutung übergreifend als Resultat eines Prozesses zunehmender Einschränkung von Wahlmöglichkeiten nicht nur zu charakterisieren, sondern praktisch zu simulieren innerhalb des Rahmens frame, der von einer Situation script vorgezeichnet wird.
Die Auswahl der Papers durch die für COLING 76 zuständige Programm-Kommission unter Leitung von M. Kay ließ eine offenbar nicht auf Repräsentativität abzielende Schwerpunktbildung in drei Bereichen erkennen: maschinenunterstützte bzw. automatische Übersetzungssysteme, anwendungsorientierte Frage-Antwort-Systeme, sowie der durch den Einfluß der AI geprägte Komplex der im weiteren Sinne semantischen Ansätze. Diese Schwerpunkte ergaben sich nach Auskunft der Programm-Kommission einmal aus den am Ort (Ottawa, Montreal) vorhandenen Übersetzungsprojekten, sowie durch die in den USA (Stanford, Yale, MIT, Bolt-Beranek-Newman) zur Zeit verstärkt betriebenen Projekte zur praxisnahen Entwicklung von World-Knowledge-Modellen und Systemen zur Simulation von Verstehen in begrenzten situativen Kontexten.
Nur auf den letzteren soll im folgenden kurz eingegangen werden, da er sich - schon jetzt erkennbar - auf die anderen Bereiche auszuwirken beginnt und vermutlich einmal das Kernstück einer zukünftigen Computerlinguistik wird bilden können.
Sieht man von den Vorträgen C. J. Fillmores (The Need for a Frame. Semantics in Linguistics) und Y. Wilks (Frames, Scripts, Stories, and Fantasies) ab, die eine umfassende, einmal auf pragmalinguistische Zusammenhänge, zum anderen auf methodologische Konsequenzen verweisende theoretische Reflexion dieser neuen Gemeinsamkeiten einleiten könnten, so wurde das Bild der Konferenz weithin bestimmt von Beiträgen, die - auf implementierbare Lösungen konzentriert - praxisnahe Entwicklungen funktionsfähiger Systeme vorstellten. So etwa zum Aufbau und zur Organisation von Datenstrukturen und Netzwerken: A Compiling System for Augmented Transition Networks (R. R. Burton/W. A. Woods), Organizing Knowledge for English-Chinese Translation (W. J. Stutzman); oder zur Modellentwicklung des Sprachverstehens: Organizing and Control of Syntactic, Semantic, Inferential, and World Knowledge for Language Understanding (F. Hayes-Roth/D. J. Mostow), A Multi-Processing Model for Natural Language Understanding (R. Smith/F. Rawson), The Application of Script-Based World Knowledge in an Integrated Story-Understanding System (R. E. Cullingford), Evolving Uses of Knowledge in a Speech Understanding System (B. Bruce/Nash-Weber); oder zum Komplex der Frage-Antwort-Systeme: Dynamic Processing and Question Answering (W. Lehnert), Query Optimization for Question-Answering Systems (R. Reiter), Supporting a Computer-Directed Natural Language Dialog for Automatic Business Programming (G. E. Heidorn).
Durchgängig fällt bei allen diesen Modellen und Systemen auf, daß von der Verfügbarkeit der primär benötigten und etwa in frames, scripts oder Netzen enthaltenen vielfältigen Informationen immer schon ausgegangen wird. Je nach Aufgabenstellung und (linguistischem) Vermögen ad hoc zusammengestellt, werden in diesen Daten Vorstellungen über Aufbau und Funktion sprachlicher und außersprachlicher Mittel vorgegeben, die von deren tatsächlichem Gebrauch in konkreten Situationen verbaler Interaktion vermutlich nicht immer abgedeckt sind. Die Tatsache jedenfalls, daß frame- oder script-based Netzstrukturen sich als fruchtbar und überaus leistungsfähig bei der Entwicklung und Konstruktion von Frage-Antwort-Systemen erweisen, rechtfertigt nicht schon die Annahme (etwa Cullingfords und Lehnerts), damit die Grundprinzipien auch der natürlich-sprachlichen Bedeutungskonstitution erfaßt zu haben. Zumal alle bisherigen Versuche, das natürlich-sprachliche Generieren/Verstehen beliebiger neuer Bedeutungen innerhalb dieser Netzstrukturen abzubilden, die Zahl der benötigten scripts oder frames explodieren läßt (Salton).
Vor diesem Hintergrund sollte die Forderung nach Formulierung empirisch überprüfbarer Hypothesen, wie sie für den Bereich der AI ausdrücklich von Wilks erhoben wurde, auf den Bereich der CL ausgedehnt werden. Wenn deren Aussagen über natürlich-sprachliches Verhalten keine im Prinzip unüberprüfbaren Behauptungen im Rahmen bestenfalls plausibler Phantasien bleiben sollen, bedarf es einer analytisch-quantitativ arbeitenden, empirischen Komponente dieser Disziplin, die anhand performanz-orientierter Textanalysen die Adäquatheit und Erklärungsstärke modelltheoretischer Hypothesen aus kompetenz-orientierten Theorien empirisch zu überprüfen gestattet. Freilich kann davon, trotz der in diese Richtung weisenden Beiträge von S. Allen (Text-Based Lexicography and Algorithmic Text Analysis), J. King/I. McMasters/J. R. Sampson (Computer Acquisition of Natural Language: Experimental Tests of a Proposed System) oder W. Moskovich, bisher noch nicht eigentlich die Rede sein.
Dabei würden sich zahlreiche im Bereich des Document Retrieval verwendete Techniken, die - wie G. Salton (A Comparison of Term Value Measurements for Automatic Indexing) einmal mehr nachwies - semantische Textcharakteristika erfolgreich zu ermitteln erlauben, unmittelbar umsetzen und nutzen lassen für eine quantitative Analyse bedeutungskonstituierender Regularitäten in nun allerdings pragma-linguistisch zu definierenden Korpora natürlich-sprachlicher Texte. Die damit erst sich bietende Möglichkeit zu wechselseitiger Kontrolle von theoretisch-formaler Modellbildung einerseits und empirisch-experimenteller Datenerhebung andererseits würde den Prozeß der Konsolidierung der CL als Disziplin sicherlich beschleunigen. Solange allerdings Fragen der Organisation von Datenmengen und der Konstruktion von Netzen, der Kodierung und Repräsentation von Informationen und die praktische Entwicklung oder anwendungsbezogene Optimierung funktionsfähiger Systeme die Aktivitäten dieser Disziplin ausmachen, wird ihr Verhältnis zur Linguistik vorerst eher wie das einer Ingenieurwissenschaft beschrieben werden müssen, der die Theorienbildung der Physik entbehrlich scheint. Die Hoffnung, daß CL vom bloßen Anwendungsbereich der Computerwissenschaft zum so notwendigen, weil harte Daten verarbeitenden Teilbereich einer wahrhaft empirisch zu nennenden Linguistik werden möge, fand auf der 6. Tagung für Computational Linguistics noch wenig Nahrung.

An der vom Department of Linguistics der Universität Ottawa ausgerichteten und im ganzen wohl vorbereiteten und organisierten Konferenz nahmen rund 200 Wissenschaftler aus etwa 20 Ländern teil. Sie machten zirka 75 Prozent der ursprünglich gemeldeten Interessenten aus, von denen allerdings viele durch einen Streik der kanadischen Fluglotsen und Air Canada am Kommen gehindert wurden. Daß - wie schon bei den früheren Tagungen - die Länder des Ostblocks nicht vertreten waren (Ausnahme: Tschechoslowakei), ist dagegen wohl nicht auf den Streik zurückzuführen. Wegen der bedauerlichen, überdies sehr kurzfristigen Ausfälle - z. B. war keiner der mit zugesagten Beiträgen angemeldeten sowjetischen Wissenschaftler erschienen - konnten von den ursprünglich vorgesehenen eingeladenen Vorträgen (lectures), eingereichten und akzeptierten Vorträgen (papers) und den praktischen Vorführungen (demonstrations) nur etwa 60 zum Teil in bis zu vier parallelen Veranstaltungen während der vier Kongreßtage stattfinden. Ein zur Halbzeit eingeschobener Exkursionstag (Upper Canada Village) bot eine willkommene Unterbrechung.
Allgemein wurde am Tagungsprogramm von Teilnehmern kritisiert, daß ein (privates) Forschungsinstitut (BBN, Cambridge, Mass.) offenbar besondere Bevorzugung (6 papers) genoß. Rücksichten der Programm-Kommission auf die in Kanada notwendige, bi-linguale (französisch/englische) Ausgewogenheit führten überdies im Rahmen der in Ottawa vertretenen europäischen Forschung zu einer gewissen Überbetonung (9 papers) von Projekten aus Frankreich (Grenoble, Paris, Rouen, Straßburg). Dabei war auffallend, daß sowohl England (1 paper) als auch die Bundesrepublik (2 papers) - gemessen an den jeweiligen Forschungsaktivitäten in diesen Ländern deutlich unterrepräsentiert waren. Für den mit der computerunterstützten linguistischen Forschung bei uns weniger vertrauten Beobachter konnte daher der Eindruck entstehen, daß es in der Bundesrepublik - mit ihrer (nach den USA höchsten) Zahl und Dichte an Großrechenanlagen - eine im internationalen Vergleich beachtliche Computerlinguistik nicht gäbe. Ob diese Unterrepräsentation allerdings ausschließlich auf die Programm-Kommission zurückzuführen ist oder sich teilweise auch aus der geringeren Bereitschaft westdeutscher Linguisten erklärt, überhaupt Papers anzubieten, muß dahingestellt bleiben.
Dagegen waren die für COLING 76 herrschenden Auswahlprinzipien entscheidend dafür, daß jene neueren Ansätze in der computerunterstützten Linguistik noch völlig ausgeklammert blieben, die über die Theorie der unscharfen Mengen (fuzzy sets) bzw. die Toleranztopologie empirisch wie theoretisch angemessenere Modelle und Systeme zu entwickeln suchen auf Gebieten wie der Knowledge Representation, der Inferenzprobleme bei unvollständiger Kenntnistage, sowie der natürlich-sprachlichen Bedeutungskonstitution. So kamen weder die Forschungsgruppe von L. A. Zadeh (Berkeley, Cal.) noch die von B. R. Gaines (Sussex, Engl.) zu Wort, die im Bereich der computerunterstützten Entwicklung von Systemen des logischen Schließens mit natürlich-sprachlichen Aussagevariablen, der Repräsentation von natürlich-sprachlichem Wissen und der Problemlösung bei unscharfer Aufgabenstellung arbeiten. Von dem derzeitigen Stand dieser gerade für die Computerlinguistik interessanten Entwicklung, die etwa auf der Tagung für Cybernetics and Systems Research (EMCSR 76) in Wien deutlich geworden war, fand sich im offiziellen Programm von COLING 76 nichts.
Als Tagungsort für COLING 78 wurde, um den Wissenschaftlern der Ostblockländer die Teilnahme zu erleichtern, Varna (Bulgarien) vorgesehen, alternativ auch noch Bergen (Norwegen) und Bonn (Bundesrepublik).


Footnotes:

1Colby, K. M.: Simulation of Believ Systems  in: Schank/Colby: Computer Models of Thought and Language, San Francisco 1973, 251-286.

2Minsky, M.: A Framework for Representing Knowledge, MITAI-Lab.-Memo Nr. 3o6, 1974.

3Schank, R. C.: Using knowledge to unterstand  in: Theoretical Issues in Natural Language Proessing, Cambridge/Mass. (BBN) 1975, 117-121.