fit 2002 > Computer als (Kommunikations-) Partner > Konzepte und Techniken > Natürliche Sprachverarbeitung

Natürliche Sprachverarbeitung 

  
Wenn es nach den Grünen gegangen wäre, bestünde das Handy immer noch aus zwei mit einer Kordel verbundenen Joghurtbechern.“ Guido Westerwelle, deutscher Politiker [WEST]

Natürliche Sprachverarbeitung basiert auf Intelligenten Informationssystemen (IIS). IIS bestehen aus einer Reihe von Teilkomponenten, die ich anhand des Beispiels „Intelligente Telefonsysteme“  und Suchmaschinen im Internet erläutern möchte. Ein einfaches Beispiel für ein Feature eines intelligenten Telefonsystems ist die Auswahl eines Gesprächspartners im gespeicherten Telefonbuch über Sprache, das jedes (halbwegs) moderne Handy besitzt. Die Realisierung basiert auf folgenden Komponenten:

*) Natürliche Sprache:

In diesem Bereich helfen Systeme mit künstlicher Intelligenz bei der Übersetzung von Texten, bei Anfragen an Datenbanksysteme in natürlicher Sprache, und sie unterstützen mit Hilfe von Thesauren und Datenbanken das Suchen und Filtern von riesigen Datenmengen (z.B. im Internet). Eine besondere Schwierigkeit dabei ist das Unterscheiden von gleichen (bzw. gleichklingenden, wenn es sich um akustische Spracheingabe handelt) Wörtern mit unterschiedlicher Bedeutung. Gelöst wird es mit Hilfe von Thesauren, die versuchen, aus dem Zusammenhang heraus das Wort mit der richtigen Bedeutung zu erkennen (funktioniert, da Wörter oft typischerweise miteinander auftreten) findet zum Beispiel auch Anwendung bei OCR Programmen – also automatischer Texterkennung.

*) Maschinelles Lernen:

Unter maschinellem Lernen versteht man die Fähigkeit eines Systems, sich an unterschiedliche Umwelttypen anzupassen, und das selbständige Lernen aus Beispielen („Training“). Dem Handy müssen Beispielsweise die Namen, die es (akustisch) erkennen soll, erst beibringen, bevor man dieses Feature nutzen kann. Im Gegensatz dazu kommen gute Spracherkennungsprogramme ohne „Training durch den Enduser“ aus, da sie bereits über das nötige Wissen (also Datenbanken, Thesaurus, ...) verfügen (siehe Punkt vorher). Maschinelle Lernverfahren können Regelmäßigkeiten in symbolischen Datenmengen entdecken und formulieren, selbstständig Klassifizieren, und Regeln für die Beschreibung von Daten formulieren.

*) Heuristische Suchverfahren:

Das Forschungsgebiet der Künstlichen Intelligenz hat eine Vielzahl von Methoden entwickelt, um große, abstrakte Problemräume nach Lösungen zu durchsuchen. Diese heuristischen Suchverfahren spielen bei allen Informationssystemen, in denen enorme Mengen an Daten verarbeitet wird müssen, eine große Rolle.

*) Constraints:

Ursprünglich im Bereich der logischen Programmierung entstanden, gehört das Lösen von Problemen unter einschränkenden Randbedingungen zu einem der innovativsten Forschungsgebiete der Künstlichen Intelligenz. Die Anwendungen reichen von der Lösung komplexer Optimierungsprobleme bis zur Entwicklung neuartiger Expertensysteme. 

*)Wissensrepräsentation:

Im Bereich der künstlichen Intelligenz gibt es zahlreiche Methoden, mit denen konzeptuelle Zusammenhänge ("Wissen") auch für riesige  Mengen an Daten beschrieben werden können. Auf diesen Methoden basieren die Voraussetzungen für die Realisierung von Taxonomien, Thesauren, Wörterbüchern, und anderen Systemen, die in heterogenen Informationssystemen eine wichige Vermittlerrolle übernehmen müssen. Gemeinsam mit Programmiertechniken der AI entstehen auf diese Art wissensbasierte Systeme mit ihrem breiten Anwendungsspektrum. 

*)Neuronale Netze:

siehe Game AI.
  

[WEST] http://www.gym-rinteln.de/50jahre/unterhaltung/sprueche.html

>Entstehungskontext | Konzepte und Techniken | Entwicklung und Auswirkungen | Praxis | Bewertung