Was ist Computerlinguistik?

Die Computerlinguistik beschäftigt sich mit der Verarbeitung natürlicher Sprache in Computersystemen. Zu ihren Schwerpunkten gehören sowohl anwendungsbezogene wie grundlagenforschungsorientierte Fragestellungen, darunter:

  1. die Schaffung von (Software-)Werkzeugen, die die Mensch-Maschine-Kommunikation (MMK) durch die Verarbeitung sprachlicher Daten erleichtern (z.B. natürlichsprachliche Dialogsysteme zur Kommunikation mit Datenbanken und anderen Informationssystemen, automatische Beantwortung von Emails, sprachgesteuerte Computer und andere Systeme, Sprachausgabe);

  2. maschinelle, vor allem sprach- und texttechnologische Hilfsmittel zur Verarbeitung von Texten in natürlicher Sprache zu verschiedensten Zwecken (z.B. Diktierprogramme, Rechtschreibungs-Korrekturprogramme, Vorlesemaschinen, Übersetzungssysteme, Übersetzungshilfen, Information Retrieval, Inhaltsanalyse, Dokumenten-Management, Text-Indexing, Textverstehenssysteme, Textgenerierung usw.), ein Bereich der seit Jahren in der „Informations- und Kommunikations-Gesellschaft“ immer größere Bedeutung erlangt.

  3. die Untersuchung sehr großer Mengen von Sprachdaten (z.B. Textkorpora) vor allem mit Hilfe statistischer und anderer quantitativer Methoden, um möglichst fehlerfrei und komfortabel komplexe Beschreibungen von Sprachen anfertigen zu können (Wörterbücher, Grammatiken), bzw. das Anlegen und Pflegen großer Sammlungen textueller Daten (Korpuslinguistik),

  4. die Ausnutzung von Eigenschaften der natürlichen Sprache mittels Computer für andere Zwecke, z.B.: Erkennung der Sprache, in der ein Text geschrieben wird/wurde, Autorenbestimmung für philologische, forensische und andere Zwecke,

  5. die Erforschung der Zusammenhänge von Eigenschaften sprachlicher Strukturen und Prozesse bis hin zur Entdeckung universeller Sprach- und Textgesetze. Die computerlinguistischen Verfahren dienen hier vor allem der Überprüfung entsprechender Hypothesen anhand von großen Mengen authentischen Sprachmaterials.