Technologie
Die in den Produkten verwendeten Technologien beruhen auf Ergebnissen aus Forschung und Entwicklung, die in den letzten 10 Jahren am Lehrstuhl für Automatische Sprachverarbeitung des Instituts für Informatik der Universität Leipzig entstanden. Speziell handelt es sich dabei um:
- Schnelle Verfahren zur statistischen Auswertung großer Textmengen (bis zu einem Umfang von mindestens 1 Milliarde laufender Wörter, mit anderen Worten ca. 10 GB ASCII-Text)
- Leistungsfähige Verfahren zur Bestimmung von Begriffsassoziationen: Damit werden wichtige, aussagekräftige Begriffe in Texten automatisch erkannt und klassifiziert. Diese Verfahren sind sprachunabhängig, funktionieren also auch für andere Sprachen.
- Zuordnung von Dokumenten: Auf Grund der ermittelten relevanten Begriffe werden Dokumente in Klassen eingeteilt. Speziell können einzelne Dokumente entsprechend vorgegebener Profile weitergeleitet oder ähnliche Dokumente zusammengefasst werden.
Weitere Informationen und Beispiele zur Architektur des linguistischen Frameworks finden Sie in dem folgendem PDF:

