Unscharfe Semantik natürlicher Sprache.
Zum Problem der Repräsentation und Analyse vager Wortbedeutung 1

Burghard Rieger

Zusammenfassung

Nach einem kritischen Überblick der bisher einflußreichsten Ansätze zur Repräsentation und Analyse der Vagheit natürlich-sprachlicher Bedeutung im ersten Teil, wird im zweiten Teil die Repräsentation vager Bedeutungen formal über ein System unscharfer Teilmengen durch konsekutive Abbildungen des Vokabulars auf sich selbst vorgeschlagen, um im dritten Teil aufgrund statistischer Meßvorschriften mit an wirklichen Textcopora ermittelten empirischen Daten verknüpft zu werden. Im Unterschied zu dem von L.A. Zadeh vertretenen referenztheoretischen Ansatz wird jedoch ein strukturalistisches Semantikmodell entworfen, für das die Vagheit natürlich-sprachlicher Bedeutung konstitutiv ist.

I.  

It should be noted that the semantic analysis of a given natural language poses enormous difficulties because of the great complexity and apparent vagueness of the relevant phenomena. Problems of this kind are relevant not only for the adequate description of particular languages, but also for the development of the general theory, since a general theory is valid only in so far as it is based on empirical facts. Semantic analysis must therefore start with small, clear sub-systems, developing thereby the necessary basic concepts. Such islands must then be extended to larger complexes and more intricate problems. In this way, we may finally reveal also the basic structure underlying the apparently vague and imprecise phenomena of meaning in natural languages. This process is in its very beginning. (S. 184)

Die Perspektiven und Aufgaben zukünftiger Forschung auf dem Gebiet der linguistischen Semantik, die BIERWISCH (1970) in klarer Einschätzung der Gegebenheiten sah könnten leicht dahin mißdeutet werden, als handelte es sich bei dem Phänomen der Vagheit natürlich-sprachlicher Bedeutung um ein allgemein noch kaum erkanntes Problem. Der Eindruck, den zumindest die linguistischen Semantiktheorien in dieser Hinsicht vermitteln, trügt jedoch.

Denn als FREGE (1882) die Notwendigkeit seiner Begriffsschrift mit der ''Unvollkommenheit der Sprache'' begründet, nennt er neben deren Mangel an Eindeutigkeit schon jene Fälle die ''gefährlichsten ..., in denen die Bedeutungen des Wortes nur wenig verschieden sind, die leisen und doch nicht gleichgültigen Schwankungen''. Daß er freilich in diesen gleichzeitig auch die Voraussetzungen dafür erkennt, daß Sprache sich flexibel ihren unterschiedlichen (kommunikativen) Aufgaben anzupassen vermag, wird dabei gern übersehen:

Die hervorgehobenen Mängel haben ihren Grund in einer gewissen Weichheit und Veränderlichkeit der Sprache, die andererseits Bedingung ihrer Entwicklungsfähigkeit und vielfältigen Tauglichkeit ist. (S. 52)

Und diese Mängel der Sprache haben nicht nur zur FREGEschen Begriffsschrift und der von ihr initiierten logischen Semantik und analytischen Sprachphilosophie geführt. Vielmehr wurde mit deren wachsendem Einfluß gerade in der modernen Linguistik auch zunehmend der Blick dafür verstellt, daß die ''gewisse Weichheit und Veränderlichkeit'', ''die leisen und doch nicht gleichgültigen Schwankungen'' der Bedeutungen einen zentralen Gegenstand gerade der linguistischen Semantik hätte bilden können und müssen.

Obwohl aber die Vorstellung von Vagheit, Verschwommenheit oder Unschärfe natürlich-sprachlicher Bedeutung eine seither in Sprachphilosophie und Sprachwissenschaft gleichermaßen geläufige Einsicht ist, wurde sie dennoch für kaum eine der bisherigen Semantiktheorien konstitutiv. Weder die sprachinterne Auffassung der strukturellen Semantik, welche die Bedeutung eines sprachlichen Ausdrucks im wesentlichen als von dessen Stellung im System der übrigen Ausdrücke abhängend beschreibt (Wortfeld), noch die sprachexternen Bedeutungstheorien der Referenzsemantik, die von Bedeutung im wesentlichen als von einer Abbildung (Bezeichnungsfunktion) sprechen, vermöge derer jedem sprachlichen Ausdruck konkrete oder begriffliche, jedenfalls außersprachliche Entitäten zugeordnet sind, thematisieren den Aspekt der Vagheit. Dies ist umso verwunderlicher, als es einerseits gerade im Rahmen der Bestrebungen der logisch-semantischen Sprachphilosophie, deren Einfluß auf die moderne Linguistik unübersehbar ist, nicht an Hinweisen und Bezugnahmen auf das Problem des Ungenauen, Vagen, Unbestimmten in der Sprache fehlt. Daß andererseits der strukturelle Ansatz gerade mit seinem Konzept des sprachlichen bzw. semantischen Feldes dem Prinzip der Variabilität und Unschärfe noch am nächsten steht, kann dabei ebensowenig übersehen werden, wie die im ganzen erfolglosen Versuche, seine intuitiv plausible Metaphorik in eine methodologisch fundiertere, empirische Feldtheorie der Bedeutung zu überführen.

Die erste Analyse des Phänomens der Vagheit kommt denn auch aus sprachphilosophisch-realistischer Sicht. In ihr hat RUSSELL (1923) Vagheit allgemein gekennzeichnet als Eigenschaft nicht von Gegebenheiten (occurrences), sondern von Abbildungen von Gegebenheiten (representations). Ein Teil der oft beklagten Mängel der natürlichen Sprache ließ sich damit auf deren hybriden Status zurückführen, gleichzeitig ein System sowohl von Abbildungen wie auch von Gegebenheiten zu sein.

There is a certain tendency in those who have realised that words are vague to infer that things also are vague ... This seems to me precisely a case of the fallacy of verbalism - the fallacy that consists in mistaking the properties of words for the properties of things. Vagueness and precision alike are characteristics which can only belong to a representation, of which language is an example. They have to do with the relation between a representation and that which it represents. Apart from representation, whether cognitive or mechanical, there can be no such thing as vagueness or precision. (S. 84f.)

Vor dem Hintergrund der allgemeinen Charakterisierung ein-eindeutiger (bijektiver) Abbildungen läßt sich Vagheit derart referenztheoretisch explizieren als nicht-eindeutige (surjektive) Abbildung eines Systems von Termen auf ein anderes System von Termen.

One system of terms related in various ways is an accurate representation of another system of terms related in variaus other ways if there is a one-one relation of the terms of the one to the terms of the other, and likewise a one-one relation of the relations of the one to the relations of the other, such that, when two or more terms in the one system have a relation belonging to that system, the corresponding terms of the other system have a corresponding relation belonging to the other system ... Per contra, a representation is vague when the relation of the representing system to the represented system is not one-one, but one-many. (S. 89)

Speziell für die kognitiven Leistungen solcher Abbildungen unterschiedlicher Systeme auf Sprache kann daher die Kenntnis (knowing) als eine Gegebenheit unterschieden werden von dem Wissen (knowledge) als der Abbildung solcher Gegebenheiten, wie sie im System ''Sprache'' als Menge dessen vorliegen, was in unterschiedlicher Weise vom System ''Welt'' jeweils gewußt wird (is known).

Knowing is an occurrence having a certain relation to some other occurrence, or groups of occurrences, or characteristic of a group of occurrences, which constitutes what is said to be known. When knowledge is vague, this does not apply to the knowing as an occurrence; as an occurrence it is incapable of being either vague or precise, just as all other occurrences are. Vagueness in a cognitive occurrence is a characteristic of its relation to that which is known, not a characteristic of the occurrence itself. (S. 85)

Obwohl es in diesem realistisch-semantischen Ansatz RUSSELLs eine Differenzierung in ''extensionalen'' Bezugs-Aspekt und ''intensionalen'' Bedeutungs-Aspekt noch nicht gibt, scheint diese Unterscheidung - angesichts des Versuchs, Vagheit von Wissen als Eigenschaft der Abbildung von ''Welt'' auf ''Sprache'' (Bezug) abzuheben gegen Vagheit von Kenntnis als Eigenschaft der Abbildung von schon ''Gewußtem'' in ''Sprache'' (Bedeutung) - sich doch schon anzudeuten, wenn auch eher als gleitender Übergang, denn als abrupter Sprung.

This has a reason in our physiological constitution. Stimuli which for various reasons we believe to be different produce in us indistinguishable sensations. It is not clear whether the sensations are really different like their stimuli and only our power to discriminate between sensations is deficient, or whether the sensations themselves are sometimes identical in relevant respects even when the stimuli differ in relevant respects ... What is clear is that the knowledge that we can obtain through our sensations is not as fine-grained as the stimuli to those sensations ... It is this fact that ... has led us to regard the knowledge derived from the senses as vague. And the vagueness of the knowledge derived from the senses infects all words in the definition of which there is a sensible element. (S. 87)

Vagheit wird damit generell zum ''matter of degree, depending upon the extent of the possible differences between different systems represented by the same representation. Accuracy, on the contrary, is an ideal limit.'' (S. 90)

Die Begriffsbildung CARNAPs (1956), der Bedeutung (meaning) und Anwendung (application) als zwei klar in ''Intension'' und ''Extension'' unterschiedene Aspekte bei der semantischen Analyse sprachlicher Ausdrücke untersucht, führt - im Unterschied zu der von RUSSELL entwickelten Vorstellung - zu einer eigentümlich verengten, theoretischen Sicht des Vagheitsphänomens.

Bei dem Versuch, die Bedeutung von Prädikaten durch Zuordnung von Intensionen als eine allerdings nicht nur theoretische, sondern am tatsächlichen Sprachverhalten empirisch überprüfbare Hypothesenbildung zu erweisen, geht CARNAP zur Repräsentation und Analyse vager Bedeutung nicht von einem Kontinuum aus, dessen ideale Extreme erst zu (positiven bzw. negativen) Eindeutigkeiten führen, sondern er setzt umgekehrt diese Idealisierung schon voraus, um Vagheit dann als eine (möglicherweise leere) Zone zu explizieren, in der eine eindeutige Zuordnung eines Prädikats zu einem Objekt aufgrund komplementärer Eigenschaften nicht möglich ist.

The intension of a predicate "Q" for a speaker X is the general condition which an object y must fulfil in order for X to be willing to ascribe the predicate "Q" to y ... That a predicate "Q" in a language L has the property F as its intension for X, means that among the dispositions of X constituting the language L there is the disposition of ascribing the predicate "Q" to any object y if and only if y has the property F ... In order to take vagueness into account, a pair of intensions F1, F2 must be stated: X has the disposition of ascribing affirmatively the predicate "Q" to an object y if and only if y has F1; and the disposition of denying "Q" for y if and only if y has F2. Thus, if y has neither F1 nor F2, X will give neither an affirmative nor a negative response; the property of having neither F1 nor F2 constitutes the zone of vagueness, which may possibly be empty. (S. 242)

Dieser scheinbar auf Operationalisierung und Überprüfbarkeit bedachte Versuch einer Explikation von Vagheit genügt aber gerade der Forderung nach empirischer Adäquatheit nicht, wenn er - entgegen aller sprachverwendenden Erfahrung - Vagheit gleichsam negativ als die Abwesenheit eindeutiger Zuordnungsmöglichkeiten begreift. Wie schon RUSSELL hervorhob, ist auf diesem Wege eine adäquate Repräsentation des Phänomens nicht möglich.

The fact is that all words are attributable without doubt over a certain area, but become questionable within a penumbra, outside which they are again certainly not attributable. Someone might seek to obtain precision in the use of words by saying that no word is to be applied in the penumbra, bot fortunately [!] the penumbra itself is not accurately definable, and all the vaguenesses which apply to the primary use of words apply also when we try to fix a limit to their indubitable applicability. (S. 87)

Auf eben diese Tatsache bezieht sich WITTGENSTEIN (1958) in seinen Überlegungen zur Bedeutung natürlich-sprachlicher Prädikate, wenn er deren Vagheit gleichsam positiv über eine Art ,,Familienähnlichkeit'' zu explizieren sucht, die sich pragmatisch in ''Sprachspielen'', d.h. für bestimmte Sprecher in bestimmten Anwendungskontexten herausbildet. Danach wird - in Abwandlung der Formulierung CARNAPs - den Objekten y das Prädikat ''Q'' nicht etwa deshalb zugesprochen, weil es unter den Sprecherdispositionen, die ein Sprachspiel ausmachen, eine gibt, die das Prädikat ''Q'' allen Objekten y dann (und nur dann) zuschreibt, wenn ihnen die Eigenschaft F gemeinsam ist, sondern weil die Sprecherdispositionen eines Sprachspiels gerade darin bestehen, das Prädikat ''Q'' allen Objekten y schon dann zuzuschreiben, wenn zwischen ihnen nur gewisse Ähnlichkeiten bestehen.

Betrachte z.B. einmal die Vorgänge, die wir ''Spiele'' nennen. Ich meine Brettspiele, Kartenspiele, Ballspiele, Kampfspiele usw. was ist allen diesen gemeinsam? - Sag nicht: ''Es muß ihnen etwas gemeinsam sein, sonst hießen sie nicht ,Spiele`'' - sondern schau, ob ihnen allen etwas gemeinsam ist. - Denn, wenn du sie anschaust, wirst du zwar nicht etwas sehen, was allen gemeinsam wäre, aber du wirst Ähnlichkeiten, Verwandtschaften, sehen ... Wir sehen ein kompliziertes Netz von Ähnlichkeiten, die einander übergreifen und kreuzen. Ähnlichkeiten im Großen und Kleinen. Ich kann diese Ähnlichkeiten nicht besser charakterisieren als durch das Wort ''Familienähnlichkeiten''. (S. 66)

Daß die daraus erwachsende Unschärfe von Begriffen nicht etwa (negativ) als eine bloße Folge von Unwissenheit erscheint, sondern (positiv) begriffen wird als Fundament zwar möglicher, für ihre Brauchbarkeit aber durchaus nicht notwendiger gradueller Präzisierung, macht der Rückgriff auf die Pragmatik deutlich, d.h. hier die Vermittlung der Regeln für den Gebrauch von Prädikaten in kommunikativen Situationen.

Wie würden wir denn jemandem erklären, was ein Spiel ist? Ich glaube, wir würden ihm Spiele beschreiben, und wir könnten der Beschreibung hinzufügen: ''das, und Ähnliches, nennt man ,Spiele`''. Und wissen wir selbst denn mehr? Können wir etwa nur dem Andern nicht genau sagen, was ein Spiel ist? - Aber das ist nicht Unwissenheit. Wir kennen die Grenzen nicht, weil keine gezogen sind. Wie gesagt, wir können - für einen besonderen Zweck - eine Grenze ziehen. Machen wir dadurch den Begriff erst brauchbar? Durchaus nicht! ... Man kann sagen, der Begriff ''Spiel'' ist ein Begriff mit verschwommenen Rändern. - ''Aber ist ein verschwommener Begriff überhaupt ein Begriff?'' - Ist eine unscharfe Photographie überhaupt ein Bild eines Menschen? Ja, kann man ein unscharfes Bild immer mit Vorteil durch ein scharfes ersetzen? Ist das unscharfe nicht oft gerade das, was wir brauchen? (S. 69, 71)

Obwohl sich auf dieser Grundlage weder eine empirisch noch formal befriedigende Theorie der Vagheit natürlich-sprachlicher Bedeutung schon aufbauen läßt, markieren WITTGENSTEINs Überlegungen doch den Kern einer möglichen Neuorientierung in der Auffassung. Die Vorstellung von der primären Unschärfe der Begriffe und dem graduellen Charakter kontinuierlich ineinander übergehender Ähnlichkeiten wird zu einem auch lerntheoretisch entscheidenden Moment bei QUINE (1960). Danach erscheinen die einem sprachlichen Ausdruck während des Wort-Lernprozesses zugeordneten Referenzbereiche deswegen aus abgeschatteten Fällen mit unscharfen Rändern zu bestehen, weil die gesellschaftlich vermittelten Regeln solcher Zuordnung von untereinander bestenfalls ähnlichen Annahmen über das System ''Welt'' zu Termen des Systems ''Sprache'' jeweils nur unvollständig determiniert sein können, also vage in einem größeren oder geringeren Maße bleiben.

Vagueness is a natural consequence of the basic mechanism of word learning. The penumbral objects of a vague term are the objects whose similarity to ones for which the verbal response has been rewarded is relatively slight. Or, the learning process being an implicit induction on the subject's part regarding society's usage, the penumbral cases are the cases for which that induction is most inconclusive for want of evidence. The evidence is not there to be gathered, society's members having themselves had to accept similarly fuzzy edges when they were learning. Such is the inevitability of vagueness on the part of terms learned in the primitive way; and it tends to carry over to other terms defined on the basis of these. (S. 125)

In diesem Zusammenhang werden Überlegungen wichtig, die - im Anschluß an CARNAP und MONTAGUE - die begriffliche Natur von Intensionen thematisieren, ohne sie mit Begriffen einerseits oder beobachtbaren Eigenschaften von Objekten andererseits zu identifizieren und das Phänomen der Vagheit als ''partielle Intension'' ausdrücklich einzubeziehen suchen.

Der Gedanke MONTAGUEs (1968), die Intensionen sprachlicher Ausdrücke formal als Funktionen zu konstruieren, deren Definitionsbereiche alle möglichen Gebrauchskontexte in allen möglichen Welten (Referenzpunkte) und deren Wertebereiche alle möglichen Gegebenheiten (Extensionen) sind, geht zwar auf Vorstellungen CARNAPs zurück, erweitern diese aber entscheidend um die pragmatische Dimension, die LEWIS (1972) dann näher spezifiziert.

We have now found something to do at least part of what a meaning for a sentence, name, or common noun does: a function which yields as output an appropriate extension when given as input a package of the various factors on which the extension may depend. We will call such an input package of relevant factors an index; and we will call any function from indices to appropriate extensions for a sentence, name, or common noun an intension ... The plan to construe intensions as extension-determining functions originated with CARNAP ... But whereas CARNAP's extension-determining functions take as their arguments models or state-descriptions representing possible worlds, I will adopt the [ MONTAGUE's] suggestion of letting the arguments be packages of miscellaneous factors relevant to determining extensions. (S. 174f.)

Die allgemeine Bedingung dafür, daß also ein Sprecher X in einer bestimmten pragmatischen Situation (Referenzpunkt bzw. Index) bereit ist, einem Objekt y das Prädikat ''Q'' zuzuschreiben (bzw. abzusprechen), erscheint jetzt - im Unterschied zu CARNAPs Auffassung - nicht mehr durch das Vorliegen einer Eigenschaft F1 (bzw. F2) des Objekts bestimmt, sondern durch das Bündel aller pragmatisch relevanten Faktoren im Referenzpunkt bzw. Index.

Nach einem Vorschlag WUNDERLICHs (1974) lassen sich Intensionen deswegen kontextsemantisch auch generell als Regeln verstehen, die ''die Bedingungen für die Anwendbarkeit eines Ausdrucks (bzw. Begriffs) relativ zu bestimmten Anwendungs kontexten'' angeben.

Nun wissen wir, daß Begriffe sehr oft eine Vagheitszone haben, d.h. in einigen Fällen sind sie klar anwendbar, in anderen klar nicht anwendbar, in weiteren Fällen ist ihre Anwendbarkeit unbestimmt. Wenn wir die Bedingung für die Anwendbarkeit eines Begriffs in Form von Intensionen darstellen, so gibt es offenbar zwei Möglichkeiten, um die Vagheit eines Ausdrucks (Begriffs) zu explizieren: 1. Es gibt Referenzpunkte, für die der Wert der Intension nicht genau bestimmt ist, d.h. die Intension ist in einem bestimmten Bereich variabel (z.B. sei die Klasse der von einem Allgemeinnamen bezeichneten Gegenstände nicht genau abgegrenzt): Entweder sind einzelne Personen selbst schon unsicher, oder verschiedene Personen würden unter den Bedingungen des gleichen Referenzpunktes verschiedene Wertzuordnungen vornehmen. 2. Es gibt Klassen von Referenzpunkten, für die bisher überhaupt noch kein Wert der Intension bestimmt ist (z.B. weil derartige Anwendungsfälle noch nie in Frage gekommen sind); diese Art Vagheit besteht vermutlich grundsätzlich. (S. 268f.)

WUNDERLICHs Sprechweise von den (im ersten Fall) ''nicht genau'' und (im zweiten Fall) ''überhaupt nicht'' definierten Werten für Referenzpunkte bzw. Indices ist freilich insofern irreführend, weil sie konkurrierende Alternativen suggeriert, wo es keine gibt.

Denn ebenso, wie die dreiwertige Logik nicht als Alternativsystem mit der zweiwertigen Logik konkurriert, sondern sie als Spezialfall enthält, werden intensionale Zuordnungen, die weder eindeutig bejaht noch eindeutig verneint werden können, in zweiwertigen Systemen als ''überhaupt nicht'' bestimmt gelten, während sie aus eben diesem Grunde in dreiwertigen Systemen als ''nicht genau'' bestimmt (unbestimmt) erscheinen.

Von daher muß auch bezweifelt werden, ob das ursprünglich von LEWIS stammende Konzept der in bestimmten Referenzpunkten bzw. Indices undefinierten Intensionen, die bei ihm ''partielle Funktionen'' heißen, sich überhaupt zur Explikation des Phänomens der Vagheit eignet, wie dies WUNDERLICH offenbar glaubt. Während nämlich die partiellen Funktionen nur die Behandlung auch solcher Terme erlauben sollen, die in bestimmten Welten nichts bezeichnen (z.B. ''Pegasus'' in unserer physikalischen Realität), spricht WUNDERLICH von ''partiellen Intensionen'' als einer möglichen Explikation anwendungskontextueller Vagheit von Ausdrücken, der die ''völlig andere Bearbeitung der Vagheitsproblematik'' gegenüberzustellen sei, die ein dreiwertig-logischer Ansatz möglicherweise liefere.

Ersichtlich liegt aber beiden Explikationsversuchen jene Auffassung des Vagheitsphänomens zugrunde, die oben negativ genannt und als empirisch inadäquat kritisiert wurde. Danach soll Vagheit sich als eine - durch die Bereiche eindeutiger (positiver bzw. negativer) Wertzuordnungen gleichsam ausgesparte - Zone explizieren lassen, die durch in sich nicht näher differenzierte Abwesenheit eindeutiger Zuordnungen charakterisiert oder auch als Bereich unbestimmter (nicht-eindeutiger) Zuordnungen gedeutet wird.

Eine mit diesen Explikationsversionen tatsächlich konkurrierende Alternative darf dagegen nicht auf zwei- bzw. dreiwertigen Beschreibungssystemen, sondern muß auf dem System einer mehrwertigen Logik aufbauen, wenn sie der oben positiv genannten, aber bisher weder methodisch noch theoretisch durchgeformten Auffassung des Vagheitsphänomens soll gerecht werden können. Danach kann Vagheit nur als ein Kontinuum von (graduell beliebig differenzierbaren) Wertzuordnungen dargestellt werden, das sich aus einer übergreifenden Ähnlichkeitsbeziehung ergibt und eindeutige positive bzw. negative Zuordnungen nur als quasi ideale Extremwerte enthält.

Während nun eine formale Darstellung der Ähnlichkeitsbeziehung - nach frühen Ansätzen bei POINCARé (1904) und CARNAP (1928) - als binäre, reflexive und symmetrische, nicht aber transitive Relation (Toleranzrelation) vornehmlich von ZEEMAN (1962) und FISCHER (1970) in einer Theorie der Toleranzräume ausgearbeitet wurde, ist die Anwendung und Übertragung dieser zunächst abstrakten Strukturen und formalen Modelle auf empirische Daten und deren Zusammenhänge erst durch ZADEHs (1965) Theorie der unscharfen Mengen (fuzzy sets) möglich geworden, die formal-algebraische Terme mit numerisch-quantitativen Ausdrücken verknüpft.

Der Grundgedanke der Theorie der unscharfen Mengen, die die traditionelle Mengentheorie als Grenzfall enthält, ist dabei denkbar einfach und plausibel. Im Unterschied zur klassischen oder ''scharfen'' Mengentheorie, in der ein Individuum alternativ im Hinblick auf eine Menge entweder Element ist oder nicht, kann man in der neuen Theorie die Zugehörigkeit eines Individuums zu einer deswegen ''unscharf'' genannten Menge graduell angeben. Danach kann die charakteristische Funktion mA(x) eines Elementes x der Menge A nicht nur die Werte 0 (nicht-zugehörig) und 1 (zugehörig) annehmen, sondern auch jeden beliebigen anderen Wert zwischen 0 und 1, wobei mA(x) = 0,2 eine geringere Zugehörigkeit des Elements x zur Menge A anzeigt, als mA(x) = 0,8.

Allgemein wird eine unscharfe Menge A in X charakterisiert durch die Zugehörigkeitsfunktion

die jedem x Î X einen (und nur einen) Zugehörigkeitswert mA(x) aus dem Intervall [0,1] zuordnet, der den Grad angibt, mit dem das Individuum x als Element der unscharfen Menge A zu gelten hat. Die unscharfe Menge A besteht also aus der Menge der geordneten Paare

Gemäß der klassischen Definition der Verknüpfungsoperationen wird man auch für beliebige unscharfe Mengen A und B fordern, daß die Zugehörigkeitswerte der neu entstehenden unscharfen Menge C sich bei Durchschnittsbildung nicht erhöhen und bei Vereinigung nicht vermindern; ZADEH gibt daher die jeweils niedrigst bzw. höchst möglichen Werte als Definition

und für die Komplementbildung folgende Anweisung

wobei sich Gleichheit und Enthaltensein wie folgt definieren

Diese Definitionen reduzieren sich auf die klassischen Mengen, wenn man die Zugehörigkeitsfunktion auf die binär zulässigen Werte 0 und 1 einschränkt.

Wie von GAINES (1975a, b) im einzelnen ausgeführt wurde, kann ZADEHs Theorie darüber hinaus aber als Grundlage einer Basistheorie der mehrwertigen Logiken gelten. Sie erfahren so eine neue, übergreifende Interpretation und erhalten erstmals auch konkrete Anwendungsbereiche in der empirischen Beschreibung, experimentellen Simulation und theoretischen Durchdringung der Prozesse, die im Menschen tatsächlich ablaufen, wenn er urteilt, versteht, argumentiert, schließt, kurz, wenn er aufgrund der Verarbeitung von Stimuli handelt oder sich verhält.

During recent years ZADEH has developed in detail a model for approximate reasoning with vague data. Rather than regard human reasoning processes as themselves äpproximating" to some more refined and exact logical process that could be carried out perfectly with mathematical precision, he has suggested that the essence and power of human reasoning is in its capability to grasp and use inexact concepts directly. He argues that attempts to model, or emulate, it by formal systems of increasing precision will lead to decreasing validity and relevance. Most human reasoning is essentially ßhallow" in nature and does not rely upon long chains of inference unsupported by intermediate data - it requires, rather than merely allows, redundancy of data and paths of reasoning - it accepts minor contradictions and contains their effects so that universal inferences may not be derived from their presence. (S. 101)

Damit wird Vagheit in der positiven Auffassung dieses Phänomens - weit über seine Ausprägung im engeren Bereich der natürlich-sprachlichen Bedeutung hinaus - zum konstitutiven Prinzip aller kognitiven Leistungen überhaupt, als deren umfassendstes System freilich die natürliche, nicht standardisierte Sprache im doppelten Sinne sowohl als Gegebenheit (occurrence) wie auch als Abbildung von Gegebenheit (representation) gelten muß.

In diesem Zusammenhang lassen sich RUSSELLs Bemerkungen über die Genauigkeit als idealem Grenzfall der Vagheit und die glücklicherweise nicht präzisierbaren Grenzen der Vagheitszonen von Bedeutungen offenbar jener auch positiven Einschätzung anschließen, die schon FREGE den semantischen Unvollkommenheiten der Sprache zuerkannte. Und WITTGENSTEINs Anspielung, ob es nicht gerade die Unschärfe der Begriffe ist, die wir brauchen, wenn wir miteinander reden, korrespondiert der Auffassung QUINEs von der Vagheit als natürlicher Folge allen Lernens sprachlicher Ausdrücke und ihrer Bedeutungen.

Im Unterschied zur geläufigeren negativen Einschätzung des Unexakten wird in diesen Aussagen Vagheit - wenn zwar nicht ausschließlich, so zumindest doch auch - schon als ein Positivum begriffen, und dies, obwohl zunächst noch kein anwendbarer Formalismus zur Verfügung stand, der - wie die Theorie der unscharfen Mengen und die auf ihrer Basis modifizierten (fuzzified) mathematischen Strukturen - die Phänomene des Unpräzisen präzise zu beschreiben, zu analysieren und abzubilden erlaubt.

II.  

Als ZADEH (1971) sein Konzept der unscharfen Mengen erstmals auf linguistische Phänomene anwandte, ging er im Rahmen der Semantik von einem strikt referenztheoretischen Modell aus, in dem die Vagheit natürlich-sprachlicher Bedeutung sich folglich als eine unscharfe Teilmenge aller möglichen Extensionen ergab, auf die ein sprachlicher Ausdruck referiert.
Thus, a word like "green" is a name for a class in which the transition from membership to non-membership is gradual rather than abrupt. The same is true of phrases such as "beautiful women", "tall buildings", "large integers", etc. In fact, it may be argued that in the case of natural languages, most of the words occurring in a sentence are names of fuzzy rather than non-fuzzy sets, with the sentence as a whole constituting a composite name for a fuzzy subset of the universe of discourse. (S. 160)

Dazu wird zunächst die Menge der sprachlichen Ausdrücke

und ein Raum des Worübers-der-Rede (universe of discourse)

eingeführt, der hier informell als Ansammlung von Objektpunkten charakterisiert werden mag, die jedoch weit und reich genug definiert ist, daß jeder in ihr mögliche Begriff (concept) mit einer unscharfen Teilmenge von U indentifiziert werden kann.

Als Bedeutung eines Ausdrucks x Î T kann so die unscharfe Teilmenge M(x) in U erklärt werden, die sich über eine auf x restringierte Zugehörigkeitsfunktion m(yj|x) definieren läßt.

Von daher erscheint der Ausdruck x als Name der unscharfen Menge M(x), die einen Begriff in U repräsentiert.

In diesem referenziellen Sinne läßt sich Sprache nun allgemein als System verstehen, das eine Korrespondenz herstellt zwischen Ausdrücken in T und Mengen von Objektpunkten in U. Diese Korrespondenz ist eine nicht-eindeutige Beziehung. Sie kann als unscharfe Relation L aufgefaßt werden, die sich über die Zugehörigkeitsfunktion

definieren läßt. Damit wird - entsprechend (1) - jedem geordneten Paar (xi, yj) ein (und nur ein) Zugehörigkeitswert mL(xi, yj) in L zugeordnet. Die unscharfe Relation L induziert also eine Korrespondenz zwischen Elementen von T und unscharfen Mengen in U derart, daß einem sprachlichen Ausdruck x die unscharfe Menge M(x) entspricht, die seine Bedeutung ausmacht und deren Zugehörigkeitsfunktion bei

sich aus der Menge der Zugehörigkeitswerte mM(x)(yj) ergibt, die jeder Objektpunkt yj zur unscharfen Menge M(x) hat

Betrachtet man umgekehrt ein bestimmtes Element y Î U, dann definiert mL(xi,y) eine unscharfe Menge D(y) in T, in der jedes xi folgenden Zugehörigkeitsgrad hat

ZADEH nennt diese unscharfe Menge D(y) Deskriptormenge (descriptor set), weil sie dazu geeignet ist, den Grad anzugeben, mit dem jeder Ausdruck in T zur Beschreibung eines bestimmten Objektpunktes in U beiträgt.

Damit ist eine Abbildung von Bedeutungen über unscharfe Mengen von Objektpunkten M(x) bzw. eine sprachliche Repräsentation von Begriffen über unscharfe Mengen von Ausdrücken D(y) erklärt, die - auch unabhängig von dem hier zugrundeliegenden sprachexternen Semantikmodell - zumindest ''formal adäquat'' im Sinne der positiven Auffassung des Phänomens der Vagheit genannt werden kann. Allerdings bleibt die empirische Seite dieses Angangs undiskutiert, die Frage danach also, wodurch die derart als unscharfe Mengen beschreibbaren Bedeutungen von Ausdrücken festgestellt, wie die Zugehörigkeitsgrade tatsächlich ermittelt und über welchen aller möglichen Deskriptormengen sie beschrieben werden können.

Es mag die Vernachlässigung gerade der direkt umsetzbaren Anweisungen und praktischen Verfahren zur Sprachanalyse gewesen sein, die ZADEHs Neuansatz ein in der Linguistik zunächst nur geringes Echo hat finden lassen, von LAKOFF (1973), GOGUEN (1974) und RIEGER (1974) einmal abgesehen. Daß die neue Theorie besonders von den empirisch arbeitenden, anwendungsorientierten Disziplinen aufgegriffen wurde - wie dies aus der einschlägigen Bibliographie von GAINES und KOHOUT (1976) hervorgeht - muß vielmehr als indirekte Bestätigung auch der Empiriedistanz der modernen Linguistik verstanden werden, die als eher theorie-orientierte Disziplin die empirisch-praktischen Konsequenzen des unscharfen Konzepts zunächst nicht erkannte. Sie sieht sich - so RIEGER (1977) - bei der empirischen Analyse und Beschreibung natürlich-sprachlicher Bedeutung innerhalb referenztheoretischer Semantikmodelle ohnehin vor Probleme gestellt, die nur durch ''linguistisch fragwürdige'' methodische Anleihen bei der experimentellen Psychologie und Verhaltensforschung angegangen werden können. Überdies mußte ihr der Vorschlag ZADEHs (1971), der die Verfügbarkeit empirisch-quantitativer Verfahren offenbar voraussetzt, wie die unnötig numerische Notationsform im übrigen bekannter, intuitiver Vorstellungen erscheinen, wenn es bei ihm etwa heißt, daß eine Zugehörigkeitsfunktion

... can be defined in a variety of ways: in particular (a) by a formula, (b) by a table, (c) by an algorithm (recursively), and (d) in terms of other membership functions (as in a dictionary). (S. 161)

Nimmt man dagegen die Möglichkeit (d) ernst, d.h. versteht man den Hinweis ''as in a dictionary'' wörtlich, dann eröffnet sich der zunächst nur formal adäquaten, von ZADEH an einem referenz-theoretischen Semantikmodell entwickelten Notation vager Bedeutung eine auch empirisch relevante Perspektive: innerhalb jenes Systems, durch das sich - nach strukturalistischer Auffassung - die Bedeutungen der sprachlichen Ausdrücke wechselseitig definieren.

Die Frage nach der Organisation solcher Systeme ist im Laufe der Geschichte der sprachwissenschaftlichen und linguistischen Theorienbildung in der Semantik - wenn überhaupt gestellt - unterschiedlich beantwortet worden. Nach zahlreichen früheren Überlegungen zur Bedeutungsstruktur scheint der Bereich der Inhaltssemantik von der neueren Forschung eher vernachlässigt zu werden. Im ganzen haben die bisher überhaupt vorliegenden sprachwissenschaftlich-linguistischen Ansätze von der Wortfeldforschung bei TRIER (1931) und WEISGERBER (1951) über die Komponentenanalyse bei KATZ und FODOR (1963), LYONS (1963) und WEINREICH (1966) bis hin zu den umfassenden theoretischen Entwürfen bei GREIMAS (1966) und COSERIU (1970), ebenso wie die nicht fachlinguistischen Versuche etwa von OSGOOD (1952), GOODENOUGH (1956) und WALLACE und ATKINS (1960) zu zwar oft vielbeachteten Ergebnissen geführt, die aber - wenngleich aus unterschiedlichen sowohl formal-theoretischen wie auch empirisch-operationalen Gründen - nur zum geringeren Teil den Bedingungen empirisch-wissenschaftlicher Theorienbildung genügen.

Die Theorie der unscharfen Mengen und eine auf ihr aufbauende Bedeutungsnotation bietet dagegen einen übergreifenden - vom jeweils gewählten Semantikmodell unabhängigen - Formalismus, dem überdies empirisch-quantitative Verfahren zur strukturellen Bedeutungsanalyse zugeordnet werden können. Mit einer solchen Ubertragung des referenziellen Ansatzes von ZADEH auf ein strukturales Semantikmodell wird nicht nur eine zunächst sprachexterne Sicht durch eine sprachinterne Auffassung abgelöst, und es findet auch kein bloßer Aspektwechsel vom Bezug zur Bedeutung und damit von möglicher extensionaler zu intensionaler Unschärfe statt; sondern mit der Hinwendung auf das System semantischer Regularitäten, welche die Wörter eines Vokabulars untereinander dann ausbilden, wenn sie zur Abbildung von ''Welt'' (representation) dienen, wird Sprache in ihrer kommunikativen Verwendung bei Einzelnen (Idiolekte) oder bei Gruppen und Schichten (Soziolekte), während eines Zeitabschnitts (synchron) oder über mehrere Zeitschnitte hinweg (diachron) zu einer im Prinzip auch empirisch zugänglichen Gegebenheit (occurrence) erklärt, die - selbst in ihren Unexaktheiten - nun exakt beschrieben werden kann.

Nun ist Sprache aus struktureller Sicht keine bloße Menge von Wörtern, der eine Menge nicht-sprachlicher Elemente zugeordnet wäre, sondern Sprache wird begriffen als eine Menge unterscheidbarer sprachlicher Gegebenheiten erst aufgrund und im Rahmen ihres Strukturzusammenhangs, womit jenes System wechselseitiger Beziehungen (''kompliziertes Netz von Ähnlichkeiten'') gemeint ist, das - auf welcher der betrachteten (phonetischen, syntaktischen, semantischen, pragmatischen) Ebene auch immer - einzelne Elemente deswegen zu isolieren erlaubt, weil sie diesen Strukturzusammenhang in jeweils unterschiedlicher Weise abbilden. Dieses System läßt sich zunächst formal mit Hilfe unscharfer Relationen beschreiben.

Dazu wird hier - anstelle von (8) - aus dem Gesamtwortschatz einer Sprache zunächst ein bestimmtes Vokabular V als Teilmenge aller Wörter der Sprache eingeführt

und - anstelle von (9) - ein lexikalisches System C (Corpusraum)

und ein semantisches System S (Bedeutungsraum) gefordert

Beide, C und S, werden dabei anhand des Gebrauchs zu definieren sein, den wirkliche Sprecher bzw. Schreiber in tatsächlichen Texten zum Zweck der Kommunikation in bestimmten Anwendungskontexten von dem Vokabular V machen.

Während man daher C informell als eine die Unterschiede der Verwendungsregularitäten der Wörter aus V repräsentierende strukturierte Ansammlung von Corpuspunkten kennzeichnen kann, die es erlaubt, mit jeder in Elementen von V ausdrückbaren Bedeutung eine unscharfe Teilmenge von C zu identifizieren, läßt sich S etwa charakterisieren als ein durch die Unterschiede dieser unscharfen Mengen bestimmtes System von Bedeutungspunkten, das es erlaubt, mit jedem in S möglichen (potentiellen) Bedeutungspunkt eine unscharfe Menge des Vokabulars zu identifizieren.

Die strukturellen Zusammenhänge zwischen V, C und S sollen nun formal über die unscharfen Relationen R, Q und L, die offenbar nicht unabhängig voneinander sind, erfaßt und dargestellt werden. Die unscharfe Relation R, die das Vokabular V auf sich selbst abbildet, wird - wie in (10) - über die Zugehörigkeitsfunktion

definiert. Sie schreibt jedem geordneten Paar (xi, xi¢) einen (und nur einen) Zugehörigkeitswert mR(xi, xi¢) aus dem Intervall \boldsymbolI der reellen Zahlen zu. R stellt damit eine Korrespondenz her zwischen Elementen aus V und unscharfen Teilmengen von V derart, daß

1. der Gebrauch eines Wortes x aus V als unscharfe Teilmenge G(x) in V abgebildet und - wie in (12) - über die Zugehörigkeitsfunktion

definiert und

2. die Verwendungsregularität eines Wortes x¢ aus V über die unscharfe Teilmenge D(x¢) in V beschrieben und - wie in (13) - über die Zugehörigkeitsfunktion

bestimmt wird.

Definiert man Gebrauch als Verwendungsregularitäten eines Wortes und ist R eine symmetrische Relation, dann sind S(x) und D(x) identisch.

Die unscharfe Relation Q wird - wie in (17) - über die Zugehörigkeitsfunktion

definiert, die jedem geordneten Paar (xi, yj) einen (und nur einen) Wert mQ(xi,yj) aus dem Intervall \boldsymbolJ der reellen, nicht-negativen Zahlen zuordnet und damit den Zugehörigkeitsgrad in Q angibt. Q induziert damit eine Korrespondenz zwischen V und C derart, daß Elementen von V unscharfe Mengen in C und Elementen von unscharfe Mengen in V zugeordnet sind:

3. als die strukturelle Bedeutung des Wortes x aus V kann so die unscharfe Teilmenge B(x) in C erklärt werden, deren Zugehörigkeitsfunktion - wie in (18) - sich aus den Zugehörigkeitswerten mB(x)(yj) ergibt, die die Corpuspunkte yj in der unscharfen Teilmenge B(x) von C haben

Diese Werte geben gleichsam an, in welchem Maße jeder Corpuspunkt im lexikalischen System zur Bedeutung eines bestimmten Wortes des Vokabulars beiträgt;

4. als Deskriptormenge eines Corpuspunktes y aus C kann umgekehrt die unscharfe Teilmenge D(y) in V erklärt werden, die - wie in (19) - sich aus den Zugehörigkeitswerten mD(y)(xi) ergibt, welche den Wörtern xi in der unscharfen Teilmenge D(y) von V zukommen

Diese Werte geben also quasi den Grad an, mit dem jedes Wort des Vokabulars zur Unterscheidung eines bestimmten Corpuspunktes im lexikalischen System beiträgt.

Die unscharfe Relation L wird - wie in (17) und (20) - über die Zugehörigkeitsfunktion

definiert, die jedem geordneten Paar (xi, zk) einen (und nur einen) Zugehörigkeitswert mL(xi, zk) aus dem Intervall J der reellen, nicht-negativen Zahlen zuordnet. L induziert damit die Korrespondenz zwischen V und S, wonach Elementen von V unscharfe Mengen in S und Elementen von S unscharfe Mengen in V zugeordnet sind:

5. als semantisches oder paradigmatisches Feld des Wortes x aus V kann jetzt die unscharfe Teilmenge F(x) in S erklärt werden, deren Zugehörigkeitsfunktion sich aus den Zugehörigkeitswerten mF(x)(zk) ergibt, welche die Bedeutungspunkte zk in der unscharfen Teilmenge F(x) von S haben

Diese Werte geben demnach an, in welchem Maße jeder Bedeutungspunkt im semantischen System zum semantischen Feld eines Wortes des Vokabulars gehört;

6. als Deskriptormenge eines Bedeutungspunktes z aus S kann umgekehrt die unscharfe Teilmenge D(z) in V erklärt werden, die sich aus den Zugehörigkeitswerten mD(z)(xi) ergibt, welche den Wörtern xi in der unscharfen Teilmenge D(z) von V zukommen

Diese Werte geben demnach den Grad an, mit dem jedes Wort des Vokabulars zur Unterscheidung eines bestimmten Bedeutungspunktes im semantischen System beiträgt.

Dabei definiert die auf x eingeschränkte unscharfe Relation R, die den Gebrauch G(x) eines Wortes x aus V als unscharfe Teilmenge in V abbildet, einen Corpuspunkt y im lexikalischen System C

und die auf x eingeschränkte unscharfe Relation Q, die die Bedeutung B(x) eines Wortes x aus V als unscharfe Teilmenge in C abbildet, definiert einen Bedeutungspunkt z im semantischen System S

derart, daß das semantische Feld F(x) eines Wortes x als unscharfe Teilmenge von S sich durch die Menge aller Bedeutungen { B(x) }k,

und die Bedeutung B(x) eines Wortes x als unscharfe Teilmenge von C sich durch die Menge aller Gebräuche {G(x) }j bestimmt

wobei der Gebrauch G(x) eines Wortes x als unscharfe Teilmenge von V definiert ist als

Anders als innerhalb des referenztheoretischen Modells lassen sich in diesem strukturalistischen Semantikmodell mit den unscharfen Relationen R, Q und L auch Meßvorschriften verbinden, die - auf konkrete Textcorpora angewandt - die numerischen Werte der jeweiligen Zugehörigkeitsgrade liefern und damit den zunächst nur über die Zugehörigkeitsfunktion mR, mQ und mL dargestellten Zusammenhang nun auch empirisch überprüfbar machen werden.

Diese Meßvorschriften der unten detailliert noch einzuführenden empirischen Koeffizienten a, d und z fungieren wie Allrelationen in V, C und S. Sie können deswegen auch als quasi ''verunschärfende'' Funktionen (fuzzifications) folgender zunächst scharfer Abbildungen [`R], [`Q], [`P], [`O], [`N] oder deren Kompositionen verstanden werden, die sich anschließend den Zugehörigkeitsfunktionen mR, mQ und mL in der dargelegten Weise parallelisieren lassen.

Ist etwa [`R] eine scharfe Abbildung von V auf sich selbst

so kann das noch einzuführende Korrelationsmaß a als Fuzzifikation von [`R] deswegen gedeutet werden, weil hierdurch jedem geordneten Paar (xi, xi¢) als Element von [`R] zusätzlich genau ein reeller Zahlenwert als Zugehörigkeitsgrad a(xi, xi¢) aus dem Intervall \boldsymbolI zugeordnet wird, derart, daß der (scharfen) Abbildung (31) nun die (unscharfe) Relation

entspricht. aR ist damit ersichtlich die (17) zuordnenbare empirische Meßvorschrift, wobei

Schränkt man den Definitionsbereich von aR auf V ein, so wird (32) zur (scharfen), Abbildung

die jedem Wort x aus V ein n-Tupel von Zahlenwerten áa(x, x1), ¼, a(x, xn) ñ aus dem Intervall \boldsymbolI zuordnet und damit für jedes x Î V genau einen Corpuspunkt y in C definiert, so daß {(xi, yj)} = [`Q].
Sei [`P] die (scharfe) Abbildung von C auf sich selbst

dann kann das noch einzuführende Distanzmaß d - entsprechend (32) - als Fuzzifikation von [`P] gedeutet werden

die jedem geordneten Paar (yi, yj) genau einen rellen, nicht negativen Zahlenwert als Zugehörigkeitsgrad d(yi, yj) aus dem Intervall \boldsymbolJ zuschreibt.

d kann darüber hinaus aber auch als Fuzzifikation von [`Q] dienen, womit (34) zur (unscharfen) Relation

wird. dQ stellt damit ersichtlich das (20) entsprechende empirische Maß dar, wobei

Läßt man - analog (34) - den Vorbereich von dP auf C eingeschränkt sein, dann wird auch (36) zur (scharfen) Abbildung

die jedem Corpuspunkt y aus C ein n-Tupel von Zahlenwerten ád(y,y1), ¼, d(y,yn)ñ aus dem Intervall \boldsymbolJ zuordnet und damit für jedes y Î C genau einen Bedeutungspunkt z Î S definiert, so daß {(yj, zk)} = [`O].

Eine (scharfe) Abbildung von V in S läßt sich nun aufgrund von (34) und (39) als Komposition von [`Q] und [`O] schreiben

die demnach aus der Menge der geordneten Paare {(xi, zk)} besteht, für die es je ein y Î C gibt, für das gilt (xi, y) Î [`Q] und (y, zk) Î [`O].
Sei [`N] die (scharfe) Abbildung von S auf sich selbst

dann kann das noch einzuführende Distanzmaß z - entsprechend (32) und (36) - als Fuzzifikation von [`N] gedeutet werden

die jedem geordneten Paar (zi, zk) genau einen reellen, nicht negativen Zahlenwert als Zugehörigkeitsgrad z(zi, zk) aus dem Intervall J zuschreibt.

z kann darüber hinaus aber auch als Fuzzifikation der (scharfen) Komposition [`(O °Q)] dienen, wodurch aus (40) sich dann

ergibt. zO °Q kann damit ersichtlich als ein der (unscharfen) Relation (23) zuordenbares empirisches Maß gelten, wobei

Damit ist die Repräsentation des semantischen Aspekts eines sprachlichen Ausdrucks x über die unscharfen Mengen G(x) seines Gebrauchs (18), B(x) seiner Bedeutung (21) und F(x) seines paradigmatischen Feldes (24) als die formale Strukturbeschreibung eines Systems konsekutiver Abbildungen des Vokabulars geleistet, denen nun über die Anwendung der Koeffizienten a, d und z bei der Analyse des in einem bestimmten Textcorpus angetroffenen Vokabulars empirische Daten zugeordnet werden, um so unterschiedliche sprachliche Gegebenheiten als spezifische Ausprägungen derselben abstrakten Repräsentationsstruktur darstellen zu können.

III.  

Auf den Zusammenhang von Anwendungskontext, kommunikativem Gebrauch und Bedeutung sprachlicher Ausdrücke ist wiederholt hingewiesen worden. Eine über mathematisch-statistische Verfahren empirisch fundierte und über Notationen der Theorie der unscharfen Mengen formal befriedigende Analyse der Vagheit natürlich-sprachlicher Bedeutung muß diesen Zusammenhang berücksichtigen. Bedeutung wird daher nicht außerhalb der Pragmatik analysiert werden können, in der sie sich konstituiert, d.h. im Zusammenhang von Kommunikation, und Bedeutung wird anhand von Gegebenheiten analysiert werden müssen, die diesen Zusammenhang empirisch zugänglich repräsentieren, d.h. anhand von ganzen sprachlichen Texten, nicht bloß Sätzen.

Als Text gilt dabei jede Folge von sprachlichen Zeichen, die im Anwendungskontext einer konkreten Situation von tatsächlichen Sprechern bzw. Hörern zum Zweck der Kommunikation geäußert bzw. erkannt werden kann.

Mit Pragmatik wird dabei der sowohl Ort und Zeit wie Gegenstand, Medium und Beteiligte umfassende situative Kommunikationsrahmen bezeichnet.

Unter Kommunikation wird der Prozeß zunehmender Einschränkung von Wahlmöglichkeit verstanden, den die daran Beteiligten über Zeichen und Zeichenfolgen (Texte) wechselseitig initiieren und nachvollziehen.

Damit braucht als Motivation solcher über Zeichen und Zeichenfolgen initiierten Kommunikation primär nicht mehr ein ''richtiges'' oder ''falsches'' Verstehen angesetzt zu werden, sondern kommunikative Akte können allgemein alle jene Handlungen heißen, die dem Abbau von Unsicherheit dienen, den die miteinander Kommunizierenden je nach pragmatischen Erfordernissen in ''größerem'' oder ''geringerem'' Grade anstreben und bzw. oder erzielen. Bedeutung läßt sich aus dieser Sicht folglich nicht als eine statische Qualität beschreiben, die Zeichen und Zeichenfolgen nun einmal haben. Vielmehr muß die Analyse und Repräsentation der Bedeutung eines Zeichens, Wortes etc. als eine Art ''Momentaufnahme'' verstanden werden, die den im Prinzip andauernden dynamischen Prozeß der Bedeutungskonstitution innerhalb des pragmatischen Anwendungskontexts eines ganzen Vokabulars quasi unter dem Blickwinkel dieses betreffenden Zeichens, Wortes, etc. über einer Pragmatik abbildet.

Diesen kommunikations- und handlungstheoretisch beschreibbaren Zusammenhang der einer pragmatischen Fundierung der Semantik im Sinne von LORENZ (1970, 1976), SCHNEIDER (1975) und NOWAKOWSKA (1976) entspricht, kann eine empirische Analyse der Vagheit natürlich-sprachlicher Bedeutung durchaus auch bei Verwendung mathematisch-statistischer Verfahren berücksichtigen. Wie von RIEGER (1972) näher ausgeführt, läßt sich dabei Gegenstand und Ziel einer Untersuchung mit der weitgehend operationalisierten Begriffsbildung von Stichprobe und Grundgesamtheit in Verbindung bringen, wie dies innerhalb der urteilenden Statistik und ihrer Methodik geschieht.

Jede textstatistische Untersuchung kann nun im Prinzip zwar davon ausgehen, daß sich in Texten - im Unterschied zu bloßen Wörter- bzw. Zeichenansammlungen - Ordnungsrelationen und regelhafte Beziehungen zwischen den verwendeten Zeichen, Wörtern, etc. aufdecken, beschreiben und messen lassen, wie dies etwa in der quantitativen Linguistik schon von ANDREEV (1959), HARRIS (1968) und SAJKEVIC (1970) und im Rahmen des Document and Information Retrieval etwa von SALTON (1961, 1976) und SPARCK JONES (1973) seit langem praktiziert wird. Wenn aber die so offenbar empirisch ermittelbaren Beziehungen für eine linguistische Theorienbildung in der Semantik relevant werden und nicht eine bloße Ansammlung numerischer Fakten und uninterpretierbarer Daten bleiben sollen, muß der jeweilige sprachliche Untersuchungsgegenstand zusätzlichen Forderungen genügen, damit seine statistische Analyse überhaupt sinnvoll genannt werden kann: er muß sich im Sinne statistischer Methodik als zufällige Stichprobe aus einer Grundgesamtheit deuten lassen, über die bestimmte wissenschaftliche Aussagen gemacht werden sollen.

Zufällig heißt eine Stichprobe dann, wenn die Operation der Auswahl eines Untersuchungsgegenstandes (hier etwa des Textcorpus) bei - im Prinzip beliebig häufiger - Wiederholung der Auswahlprozedur auf die Grundgesamtheit hin konvergiert.

Die Grundgesamtheit, die im linguistischen Bereich im allgemeinen immer fiktiv sein wird, läßt sich dabei nur vom Untersuchungsziel her bestimmen. Denn in statistischer Hinsicht ist ein Untersuchungsziel identisch mit dem Vorhaben, bei nur unvollständiger Information intersubjektiv nachprüfbare, optimale Aussagen über eine selbst nicht zugängliche Grundgesamtheit zu machen aufgrund der Analyse einzig von daraus entnommenen zufälligen Stichproben, die den Untersuchungsgegenstand bilden.

Ist - wie hier - das Untersuchungsziel eine Analyse der Vagheit natürlich-sprachlicher Bedeutung im Zusammenhang der sie fundierenden Pragmatik, dann können nur solche natürlich-sprachlichen Texte den Untersuchungsgegenstand bilden, die von tatsächlichen, dabei bestimmten Sprechern bzw. Schreibern in einer konkreten, dabei gleichartigen Kommunikationssituation geäußert worden sind. Nur ein solches Textcorpus, das pragmatisch-homogen heiße, kann als eine zufällige Stichprobe aller derjenigen sprachlichen Äußerungen gelten, die von diesen Sprechern bzw. Schreibern in dieser Pragmatik tatsächlich gemacht wurden oder doch hätten gemacht werden können, weshalb sie eine fiktive Grundgesamtheit bilden.

Bei der statistischen Analyse kann unter diesen Bedingungen der pragmatischen Homogenität des Textcorpus von einer empirischen Meßvorschrift Gebrauch gemacht werden, die erlaubt, etwa vorhandene Regularitäten der Abhängigkeit zwischen Wörtern festzustellen und deren unterschiedliche Intensitäten - von wechselseitiger Abstoßung über Beziehungslosigkeit bis zur wechselseitigen Anziehung - graduell in numerischen Werten des Intervalls von -1 bis +1 zu präzisieren. Dies leistet der Korrelationskoeffizient, der - wie (32) vorsieht - die Beziehung jeden Wortes aus dem Vokabular zu jedem anderen verwendeten Wort mißt aufgrund des Gebrauchs, den die Sprecher bzw. Schreiber von ihnen in den analysierten Texten des Corpus machen.

Werde etwa das in (14) schon eingeführte Vokabular V der Wörter xi untersucht anhand ihrer Verwendung in einem Corpus K von Texten t

in dem

den Corpusumfang U als Summe aller Textlängen ut, gemessen in der Anzahl der im t-ten Text enthaltenen Wörter (token), bezeichne und

die Gesamthäufigkeit H eines Wortes x (type) als Summe seiner Häufigkeiten ht, in allen Texten t angebe, dann lautet der modifizierte Korrelationskoeffizient a

Die Korrelationswerte eines Wortes x zu sämtlichen anderen Wörtern des Vokabulars, die nach (18) und (33) den Gebrauch von x als unscharfe Menge G(x) abbilden, liefern so - wie in (34) vorgesehen - die Daten zur Definition eines Corpuspunktes y im Corpusraum C. Das hat zur Folge, daß zwei Corpuspunkte y und y¢ in C umso näher benachbart sind, je weniger unterschiedlich die beiden sie definierenden unscharfen Mengen G(x) und G(x¢) und damit der Gebrauch der Wörter x und x¢ sind. Ihre Unterschiedlichkeit läßt sich daher als Entfernung zwischen den ihnen zugeordneten Corpuspunkten y und y¢ in C ausdrücken und etwa - wie in (36) vorgesehen - über das Euklidische Distanzmaß d empirisch bestimmen

Die Distanzwerte eines Corpuspunktes y zu sämtlichen anderen Corpuspunkten des Corpusraums, die nach (21) und (38) die Bedeutung von x als unscharfe Menge B(x) abbilden, liefern so - wie in (39) vorgesehen - die Daten zur Definition eines Bedeutungspunktes z im Bedeutungsraum S. Das hat zur Folge, daß zwei Bedeutungspunkte z und z¢ in S um so näher benachbart sind, je weniger unterschiedlich die beiden sie definierenden unscharfen Mengen B(x) und B(x¢) und damit die Bedeutungen von x und x¢ sind. Ihre Unterschiedlichkeit läßt sich daher als der Abstand zwischen den Bedeutungspunkten z und z¢ in S ausdrücken und etwa - wie in (42) vorgesehen - über das EUKLIDische Distanzmaß z empirisch bestimmen:

Die Distanzwerte z(z, zi) eines Bedeutungspunktes z zu sämtlichen anderen Bedeutungspunkten im Bedeutungsraum S liefern so - wie in (24) und (44) vorgesehen - die numerischen Daten zur Definition des semantischen oder paradigmatischen Feldes eines Wortes x als unscharfer Menge F(x) im Vokabular.

Die folgenden Beispiele sind anhand eines allerdings literarhistorischen Textcorpus berechnet, das aus der umfangreicheren Untersuchung von RIEGER (1970) schon in maschinenlesbarer Form vorlag, aber die Bedingungen der pragmatischen Homogenität weitestgehend erfüllt. Es handelt sich dabei um zwei entstehungszeitlich unterschiedene Teilcorpora K1 und K2 von Gedichttexten deutscher Studenten des beginnenden (1822-1843) und des ausgehenden (1863-1909) 19. Jahrhunderts, deren zunächst synchrone Analyse eine anschließende, diachron vergleichende Betrachtung der Verwendungsregularitäten bestimmter Wörter ihres Gebrauchs, ihrer Bedeutung und ihrer Felder für diesen lyrischen Anwendungskontext erlaubt.

In beiden Teilcorpora, die einen Umfang von T1 = 550 und T2 = 1 300 Texten mit insgesamt U1 = 21 000 und U2 = 50 000 Wortbelegen (tokens) haben, wurde das gleiche Vokabular V mit n = 315 Worttypen (types) untersucht. Als ein Worttyp zählt dabei das Lexem als Stamm eines aller Affixe und grammatikalischer Deformationen entkleideten Wortes im laufenden Text.

Die folgenden Beispiele stellen daher Ausschnitte aus den synchron ermittelten unscharfen Teilmengen des Vokabulars G1(x) und G2(x) des Gebrauchs, B1(x) und B2(x) der Bedeutung und F1(x) und F2(x) des Feldes jeweils der Wörter x = FRÜHLING, STRASSE und TOD zusammen. Die Ausschnitte, die nur die jeweils 30 Wörter mit den höchsten Zugehörigkeitsgraden enthalten sollen, umfassen deswegen hier diejenigen 30 Corpus- bzw. Bedeutungspunkte, die dem jeweils abzubildenden Punkt in C bzw. S am nächsten benachbart sind. In den folgenden Ausdrucken geben daher die den Wörtern nachgestellten Zahlen die a-Werte in abnehmender, die d- bzw. z-Werte in zunehmender Größe geordnet an.

Ob die für die unscharfen Relationen R, Q und L des entwickelten Semantikmodells hier eingesetzten und verwendeten Koeffizienten als im Sinne empirischer Adäquatheit optimal gelten können, wird nur anhand weiterer Untersuchungen und Experimente mit anderen Maßen zu erweisen sein. Die formale Darstellung natürlich-sprachlicher Vagheit über unscharfe Teilmengen des Vokabulars scheint aber unabhängig von den im einzelnen angesetzten empirischen Maßen modell-theoretische Folgerungen in zweierlei Hinsicht zu rechtfertigen: Einerseits lassen sich nach einem Vorschlag von RIEGER (1975) paradigmatische Felder einzelner Wörter auch als topologische Umgebungen von Bedeutungspunkten im semantischen Raum explizieren, wobei im besonderen die mit unterschiedlichen kommunikativen Erfordernissen wechselnde Schärfe oder Präzision einer Bedeutung über variable Toleranzen innerhalb einer toleranztopologischen Lexikonstruktur abgebildet werden kann.

Andererseits erlaubt die gleiche formale Darstellung struktureller Bedeutung eine generative Erweiterung des zunächst nur deskriptiven Modells. Wie RIEGER (1978) gezeigt hat, lassen sich die in der Theorie der unscharfen Mengen vorgesehenen Verknüpfungsoperationen und Definitionen auf diese Lexikonstruktur übertragen. Damit lassen sich einmal aus den textanalytisch ermittelten Bedeutungen durch deren Adjunktion, Konjunktion und Negation neue Bedeutungen generieren, die als wiederum unscharfe Teilmengen des Vokabulars neue Bedeutungspunkte im semantischen Raum definieren, zum anderen können aber auch strukturbestimmende Sinnrelationen wie Synonymität, Ähnlichkeit, Hyponymie, etc. zwischen vagen Bedeutungen für bestimmte kommunikative Anwendungskontexte satzunabhängig aber gleichwohl formal expliziert werden.

Beides, Variabilität der Bedeutungsschärfe in der Verwendung sprachlicher Ausdrücke und Kreativität der Bedeutungskonstitution durch den Gebrauch sprachlicher Ausdrücke werden für eine kommunikations-theoretische Erweiterung und möglicherweise dialogische Verwendung dieses semantischen Strukturmodells entscheidend werden. Denn was die statistische Korrelationsanalyse von Wörtern bzw. Lexemen in pragmatisch-homogenen Textcorpora für eine Modellbildung der natürlich-sprachlichen Semantik interessant macht, ist der Umstand, daß die in der linearen (eindimensionalen) Ordnung jedes einzelnen Textes ausgedrückten Beziehungen ( SAUSSUREs ''rapports syntagmatiques'') sich nutzen lassen zur empirischen Ermittlung relationaler (vieldimensionaler) Beziehungsstrukturen ( SAUSSUREs ''rapports associatifs''), von denen die Sprecher bzw. Schreiber oder Hörer bzw. Leser als ihrer quasi situativen Vorkenntnis in jedem ihrer in einem kommunikativen Anwendungskontext geäußerten bzw. verstandenen Texte immer schon Gebrauch machen (müssen), durch solchen Gebrauch auch ständig modifizieren, die aber jedenfalls im einzelnen Text deswegen nicht eigens mehr formuliert zu werden brauchen. Diese Beziehungsstrukturen aufgrund statistischer Analysen einer großen Anzahl pragmatisch-homogener Texte als ein vieldimensionales System wechselseitig sich vage bestimmender Unterschiedlichkeiten formal über unscharfe Mengen abzubilden, wird im vorgestellten Semantikmodell ansatzweise versucht.

Anerkennung

Meinem Kollegen DR. H.M. DANNHAUER danke ich für die Programmierung der notwendigen Rechnungen, die auf der CDC-CYBER 175 des Rechenzentrums der Rheinisch Westfälischen Technischen Hochschule Aachen haben durchgeführt werden können.

Literatur

ANDREEV, N.D.: Modelirovanie jazyka na baze ego statisticeskoj i teoretiko-mnozestvennoj struktury (Modelling language on the basis of its statistical and set theoretical structure). In: Tezisy sovescanija po matematiceskoj lingvistike, pp. 16-12. Leningrad: State University 1959 [nach W. MOSKOVICH]

BIERWISCH, M.: Semantics. In: LYONS, J. (Ed.): New Horizons in Linguistics, pp. 116-184. Harmondsworth: Pelican 1970

CARNAP, R.: Der logische Aufbau der Welt. Hamburg: F. Meiner 1928. [2. Aufl. 1961]

-: Meaning and Necessity. A Study in Semantics and Modal Logic. Chicago, London: University of Chicago Press 1956

COSERIU, E.: Einführung in die strukturelle Betrachtung des Wortschatzes. Tübingen: Niemeyer 1970

FISCHER, W.L.: Toleranzräume. Archimedes 4, 101-107 (1970)

-: Äquivalenz- und Toleranzstrukturen in der Linguistik. Zur Theorie der Synonyma. München: Hueber 1973

FREGE, G.: Über die wissenschaftliche Berechtigung einer Begriffsschrift. Z. Philos. philos. Kritik NF 81, 48-56 (1882)

GAINES, B.R.: Multivalued Logics and Fuzzy Reasoning. Lecture Notes of AISB Summer School, pp. 100-112. Cambridge (U. K.): Mimeogr. 1975 a

-: Fuzzy Reasoning and the Logics of Uncertainty. University of Essex Report EES-MMS-UNC-75. Cambridge (U.K.): Mimeogr. 1975 b

-, and KOHOUT, L.J.: The Fuzzy Decade: a bibliography of fuzzy systems and closely related topics. Internat. J. Man-Machine Studies 9, 1-68 (1977)

GOGUEN, J.A.: Concept representation in natural and artificial languages: axioms, extensions and applications for fuzzy sets. Internat. J. Man-Machine Studies 6, 513-561 (1974)

GOODENOUGH, W. H.: Componential Analysis and the Study of Meaning. Language 32, 195-116 (1956)

GREIMAS, A.J.: Sémantique Structurale. Recherche de Méthode. Paris: Hollier-Larousse 1966. [Deutsche Ausgabe: Braunschweig: Vieweg 1971]

HARRIS, Z.S.: Mathematical Structures of Language. Interscience Tracts in Pure and Applied Mathematics. New York, London: J. Wiley 1968

KATZ, J.J., and FODOR, J.A.: The Structure of Semantic Theory. Language 39, 170-110 (1963)

LAKOFF, G.: Hedges: A Study in Meaning Criteria and the Logic of Fuzzy Concepts. J. philos. Logic. 2, 458-508 (1973)

LEWIS, D.: General Semantics. In: DAVIDSON, D., and HARMAN, G. (Eds.): Semantics of Natural Language, pp. 169-118. Dordrecht: Reidel 1972

LORENZ, K.: Elemente der Sprachkritik. Frankfurt (M.): Suhrkamp 1970

-: Kommunikation durch symbolische Repräsentation. (Unpubl. Vortrag). 2. Wiener Symposium über Semiotik, 1976

LYONS, J.: Structural Semantics. Oxford (U.K.): Blackwell 1963

MONTAGUE, R.: Pragmatics. In: KLIBANSKY, R. (Ed.): Contemporary Philosophy - La Philosophie Contemporaine, pp. 102-122. Florence: Nuova Italiana Edit. 1968

MOSKOVICH, W.: Quantitative Linguistics. Perspective Paper. In: WALKER, D., KARLGREN, M., and KAY, M. (Eds.): Natural Language in Information Science, pp. 57-74. Stockholm: Scriptor 1977

NOWAKOWSKA, M.: Verbal and nonverbal communication as a multidimensional language. (Unpubl. paper). 2. Wiener Symposium über Semiotik, 1976

OSGOOD, C.E.: The Nature and Measurement of Meaning. Psychol. Bull. 3, 197-137 (1952)

POINCARé, H.: Wissenschaft und Hypothese. Leipzig: B.G. Teubner 1904

QUINE, W. VAN ORMAN: Word and Object. Cambridge (Mass.): M.I.T. Press 1960

RIEGER, B.: Poetae Studiosi. Analysen studentischer Lyrik des 19. und 20. Jahrhunderts - ein Beitrag zur exaktwissenschaftlichen Erforschung literarischer Massenphänomene. Frankfurt (M.): Thesen Vowinckel 1970

-: Warum mengenorientierte Textwissensckaft? Zur Begründung der Statistik als Methode. Z. Lit.wiss. Linguistik 8, 11-18 (1972)

-: Eine tolerante Lexikonstruktur. Zur Abbildung natürlich-sprachlicher Bedeutung auf unscharfe Mengen in Toleranzräumen. Z. Lit.wiss. Linguistik 16, 31-47 (1974)

-: On a Tolerance Topology Model of Natural Language Meaning. Proceedings of the ICCH/2. Los Angeles: University of Southern California 1975 (mimeograph)

-: Theorie der unscharfen Mengen und empirischen Textanalyse. Vortrag Deutscher Germanistentag 76. In: KLEIN, W. (Hrsg.): Methoden der Textanalyse, pp. 84-99. Heidelberg: Quelle & Meyer 1977

-: Fuzzy Structural Semantics. On a Generative Model of Vague Natural Language Meaning. In: TRAPPL, R., and HANIKA, P. (Eds.): Progress in Cybernetics and Systems Research, Vol. 5 (Proceedings EMCSR/76), pp. 495-503. New York, London: Wiley & Sons 1978

RUSSELL, B.: Vagueness. Austral. J. Psychol. Philos. 1, 84-92 (1923)

SAJKEVIC, A.J.: Korreljacionnyj analiz v lingvostatistike i ponjatie intervala teksta (Correlational analysis in lingo-statistics and the notion of text interval). In: MOSKOVICH, W. (Ed.): Voprosy lingvostatistiki i avtomatizacii lingvostaticeskikh rabot. Vol. 2, pp. 254-174, Moscow: Patent 1970 [nach W. MOSKOVICH]

SALTON, G.: Automatic Indexing: An Experimental Enquiry. J. Assoc. comput. Machinery 8, 404-417 (1961)

-: A Comparison of Term Value Measurements for Automatic Indexing. (Unpubl. paper). COLING 76, Ottawa (Canada) 1976

SAUSSURE, F. DE: Cours de linguistique générale. Lausanne, Paris: 1916. [Deutsche Ausgabe: Berlin: W. de Gruyter 1931, 2. Aufl. 1967]

SCHNEIDER, H.J.: Pragmatik als Basis von Semantik und Syntax. Frankfurt (M.): Suhrkamp 1975

SPARCK JONES, K., and KAY, M.: Linguistics and Information Science. New York: Academic Press 1973

TRIER, J.: Der deutsche Wortschatz im Sinnbezirk des Verstandes. Die Geschichte eines sprachlichen Feldes. Heidelberg: C. Winter 1931

WALLACE, F.C., and ATKINS, J.: The Meaning of Kinship Terms. Amer. Anthropol. 62, 58-80 (1960)

WEINREICH, U.: Explorations in Semantic Theory. In: SEBEOK, T.A. (Ed.): Current Trends in Linguistics. Vol. 3, pp. 395-477. The Hague: Mouton 1966

WEISGERBER, L.: Zur innersprachlichen Umgrenzung der Wortfelder. Wirkendes Wort 2, 138-143 (1951/52)

WITTGENSTEIN, L.: Philosophical Investigations - Philosophische Untersuchungen. Oxford (U.K.): Blackwell 1958

WUNDERLICH, D.: Grundlagen der Linguistik. Reinbek: Rowohlt 1974

ZADEH, L. A.. Fuzzy Sets. Inform. Control 8, 338-353 (1965)

-: Quantitative Fuzzy Semantics, Inform. Science 3, 159-176 (1971)

-: A Fuzzy-Set-Theoretic Interpretation of Linguistic Hedges. J. Cybernetics 2, 4-34 (1972)

ZEEMAN, E.C.: The Topology of the Brain and Visual Perception. In: FORT, M.K. (Ed.): Topology of 3-Manifolds and related Topics, pp. 240-156. Englewood Cliffs (N.J.): Prentice Hall 1962


1Published in: Scharff, J.-H. (Hrsg.): Naturwissenschaftliche Linguistik. Leopoldina Symposium 1976 (Nova Acta Leopoldina. Abhandlungen der Deutschen Akademie der Naturforscher Leopoldina , N.F. Bd. 54, Nr. 245), Halle/Saale (J. Ambrosius Barth), 1981, S. 251-276