Klassifizierung elektronischer Produktkataloge
Ausgangssituation
Die Poet Software AG bietet Datenbanklösungen und Dienstleistung für das Management von Produktdaten an.
Mit der Produktfamilie Poet X-Solutions unterstützt Poet die Verwaltung und Verteilung großer elektronischer Produktkataloge. Dabei steht die Konvertierung und Verarbeitung elektronischer Formate und Zuordnungssysteme (z.B. BMECat, cXML, eClass, UNSPSC u.a.) sowie der Versand der Produktdaten vom Lieferant zum Hersteller im Vordergrund.
Problem
Um Produktdaten in elektronischen Katalogen verwalten zu können, müssen die Ursprungsdaten aufbereitet und klassifiziert werden. Dies geschah ursprünglich in einem aufwendigen Prozess, in dem jeder Produktdatensatz einer XLS-Datei manuell einer eindeutigen Produktklasse zugeordnet wurde. Ein typisches Klassifikationssystem für Produktdaten, wie beispielsweise der UNSPSC, besteht aus 4 Hierachiestufen und mehreren tausend Produktklassen. Geübte und erfahrene Redakteure benötigen daher rund zwei Minuten um einen Datensatz zu klassifizieren. Nach der Klassifikation wurden in einem zweiten Schritt relevante Informationen aus den Produktbeschreibungen extrahiert und den entsprechenden Attributfeldern zugeordnet (z.B. Farbe, Höhe, Breite). Auch dieser Schritt war sehr zeitaufwendig. Die Durchführung dieser Aufgaben wurde manuell bewerkstelligt und benötigte eine spezifische Produktkenntnis, die nur wenige Mitarbeiter aufweisen konnten. Manche Produktlieferanten mussten daher auf altgediente und pensionierte Mitarbeiter zurückgreifen.
Auswirkung
Testmessungen ergaben, dass sich der Aufwand für einen Produktkatalog mit 10.000 Datensätzen bei dem beschriebenen Vorgehen leicht auf ca. 167 PT summiert. Die damit verbundenen Kosten waren signifikant und stellten für Lieferanten ein wesentliches Hindernis bei der Einführung elektronischer Kataloglösungen dar.
Lösung
Auf Basis der TextTech Suite wurde eine Klassifikationslösung entwickelt, die speziell auf die Anforderungen von Produktkatalogen zugeschnitten ist. Mit Hilfe linguistischer und statistischer Verfahren werden Produktdatensätze an Hand ihrer Beschreibungstexte identifiziert und automatisiert einer Produktklasse gezielt zugeordnet. Attributfelder werden mit Informationen aus den Beschreibungstexten befüllt.
Nutzen
Durch den Einsatz der TextTech Lösung konnte der Aufwand für die Einordnung der Produktdaten in einen Klassifikationsbaum und die Eingabe der Attributwerte um 97% gesenkt werden. Das bedeutet, dass ein durchschnittlicher Katalog mit 10.000 Produkten jetzt nur noch eine Bearbeitungszeit von 4PT anstatt der ursprünglichen 167 PT benötigt.