Technologie

Die in den Produkten verwendeten Technologien beruhen auf Ergebnissen aus Forschung und Entwicklung, die in den letzten 10 Jahren am Lehrstuhl für Automatische Sprachverarbeitung des Instituts für Informatik der Universität Leipzig entstanden. Speziell handelt es sich dabei um:

  • Schnelle Verfahren zur statistischen Auswertung großer Textmengen (bis zu einem Umfang von mindestens 1 Milliarde laufender Wörter, mit anderen Worten ca. 10 GB ASCII-Text)
  • Leistungsfähige Verfahren zur Bestimmung von Begriffsassoziationen: Damit werden wichtige, aussagekräftige Begriffe in Texten automatisch erkannt und klassifiziert. Diese Verfahren sind sprachunabhängig, funktionieren also auch für andere Sprachen.
  • Zuordnung von Dokumenten: Auf Grund der ermittelten relevanten Begriffe werden Dokumente in Klassen eingeteilt. Speziell können einzelne Dokumente entsprechend vorgegebener Profile weitergeleitet oder ähnliche Dokumente zusammengefasst werden.

Weitere Informationen und Beispiele zur Architektur des linguistischen Frameworks finden Sie in dem folgendem PDF:

Download des pdf linguistischer Framework

Lupe

Datenbasis

Ebenfalls zur Verfügung stehen die Daten des Projekts Deutscher Wortschatz. Dabei handelt es sich um eine der größten Datenbanken zur deutschen Sprache, die aus großen Textmengen (hauptsächlich Zeitungstext, aber auch viele Fachtexte) und frei zugänglichen Wörterbüchern erstellt und mit maschinellen Verfahren ergänzt wurde.

 

Marketing Akademie - Donnerstag, 24. Juni 2010

Marketing-Akademie: “Trendforschung im Web 2.0 – Social Media Monitoring in der Praxis“

13. September 2010, Düsseldorf.

 
Conference - Donnerstag, 24. Juni 2010

Conference on lessons learned from the influenza pandemic A(H1N1)2009

1./2. Juli 2010, Brüssel

http://www.influenza.eutrio.be/welcome.html 

 weiter ...
CRM Symposium - Donnerstag, 24. Juni 2010

16.CRM-Symposium - Best Practices in CRM

24. November 2010, Schloss Hirschberg / Beilngries

http://www.fwi-online.de/

 weiter ...
Fachtagung zur Qualitätsanalyse in der Automobilindustrie - Donnerstag, 24. Juni 2010

Fachtagung zur Qualitätsanalyse in der Automobilindustrie mittels Text- und Data Mining

28. September 2010, Leipzig

http://qaa.informatik.uni-leipzig.de/

 weiter ...
SymanO '10: „Online-Forschung im Marketing" - Donnerstag, 24. Juni 2010

SymanO '10: „Online-Forschung im Marketing“

22./23. September 2010, Mannheim

www.symano.de

 weiter ...
Copyright 2010 by TextTech.de   Nutzungsbedingungen  Datenschutzerklärung