Was ist Text Mining?

Mit Text Mining (oder Natural Language Processing = NLP) ist eine Klasse von Methoden gemeint, die es erlaubt, automatisiert Textbestände zu analysieren, um so

  • Dokumente zu klassifizieren
    • Zusammenfassung von nicht klassifizierten Dokumenten
    • Zuordnung zu vordefinierten Gruppen
  • Schlüsselbegriffe bzw. Konzepte zu extrahieren
  • Ontologien (Taxonomien, semantische Netze) zu extrahieren
  • Texte zusammenzufassen
  • Zusammenhänge zwischen Textbausteinen zu erkennen

Allen diesen Methoden, die auf Basis statistischer Verfahren oder Neuronaler Netze funktionieren, liegt die Annahme zugrunde, dass Häufigkeiten und das gemeinsame Vorkommen mehrerer Begriffe in einem Textbaustein Aussagen darüber zulassen, welche Bedeutung Begriffe für ein Konzept haben, bzw. wie stark einzelne Begriffe in Zusammenhang mit anderen stehen und gemeinsam eine Ontologie abbilden.

Anwendungen, die sich aus diesen Technologien ergeben sind breitgefächert, zB.

  • Anti-Spam-Software
  • Semiautomatisierter Aufbau von Semantischen Netzen
  • Assoziative Suchmaschinen
  • Dokumentklassifizierung (z.B. Patente oder eingehende Nachrichten)

 

 

 

 

Über diese Webseite

topic-maps.at ist die Seite für Einsteiger zu den Themen:

Beispiele

DPA-Recherche
MrCat: News klassifizieren
Wortschatz Lexikon

Downloads

Überblicksvortrag über Text Mining
Information-Retrieval

Links

intrafind
Intelligente Suchmaschinen

Softwarestudie: Werkzeuge für Wissensmanagement
(c) 2005 punkt. netServices