30.09.2014, 00:00 Uhr

Deutschsprachige Texte automatisch analysieren

Der Berliner Datenspezialist Neofonie gibt Entwicklern Zugang zu seinem Tools TXT Werk und damit zu seinem Text-Mining-API.
Die Stärke des Tools TXT Werk liegt in der Auswertung deutscher Texte. Die Lösung wurde ? anders als viele ursprünglich englischsprachige Technologien – von Anfang an für die ungleich kompliziertere deutsche Sprache entwickelt. Neofonie lädt Entwickler ein, auf Basis des APIs eigene Anwendungen zu programmieren. Die nicht-kommerzielle Nutzung der Schnittstelle ist für externe Entwickler kostenfrei.
Mit dem TXT Werk API von Neofonie können beliebige Texte nach semantischen Gesichtspunkten analysiert und automatisch mit Schlagworten und Metadaten angereichert werden. Dabei kommen verschiedene Sprachtechnologien und Machine-Learning-Methoden zum Einsatz. Die Texte werden thematisch klassifiziert, Schlagworte werden automatisch extrahiert, Daten und Zeiträume sowie Namenserwähnungen von Orten, Personen und Organisationen (Named Entities) werden erkannt und mit URIs aus dem Freebase Knowledge Graph verlinkt. Dadurch sind Anwendungen in der Lage, unstrukturierte Texte anzureichern und in die Linked Open Data Welt zu vernetzen.
Neofonie will den Funktionsumfang des TXT Werk APIs sukzessive erweitern. Dazu gehören unter anderem die semantische Anreicherung von Texten durch Sentimentanalyse oder das Extrahieren von direkter und indirekter Rede. Im Bereich Text Mining kombiniert Neofonie Verfahren des maschinellen Lernens mit semantischen Verfahren und setzt bei der Informationsverarbeitung auf ein flexibles und skalierbares Modul-Konzept.
Weitere Informationen finden Sie unter https://services.neofonie.de/. [bl]



Das könnte Sie auch interessieren