IBM, Trifacta 08.07.2019, 09:15 Uhr

Neues Datentool für schnellere DataOps

IBM hat eine neue Lösung zur Datenvorbereitung vorgestellt. Damit sollen DataOp-Prozesse beschleunigt werden, um Daten schneller für die Verarbeitung durch künstliche Intelligenz (KI) aufzubereiten.
(Quelle: ibm.com)
Diese Vorbereitung ist nicht nur ein notwendiger Schritt für maschinelles Lernen und Vorhersagemodelle, sondern auch der zeitintensivste. Laut einer aktuellen Studie verwenden Datenexperten derzeit mehr als 80 Prozent ihrer Zeit darauf [1]. Diese aufwändigen Prozesse sind für akkurate Daten und genaue Ergebnisse unerlässlich, können KI-Projekte aber wegen der Kosten, die sie verursachen, zum Scheitern bringen.
Mit der neuen InfoSphere Advanced Data Preparation werden diese Prozesse vereinfacht. Unternehmen können damit ihre Rohdaten automatisch formatieren, strukturieren und anreichern, so dass sie für Analysezwecke und Berichte geeignet sind, sagt IBM. Die neue Lösung wurde zusammen mit dem Software-Anbieter Trifacta entwickelt. InfoSphere arbeitet mit bereits existierenden Datenumgebungen der Kunden, was auch deren Data Lakes mit einschließt.
Unter anderem verfügt die neue Lösung über ein intuitives Dashboard, welches die Datenaufbereitungs-Prozesse sichtbar macht. Dazu gehört auch das Tracking der Datenqualität und die Bestimmung der Herkunft aller Daten. Im Ergebnis, so IBM, bekommt man saubere Datensätze, die Kunden mit den Analysewerkzeugen ihrer Wahl nutzen können.
InfoSphere Advanced Data Preparation baut mit automatischer Transformation auf den Data Lakes oder Data Warehouses der Kunden auf. Dank einer Self-Service-Schnittstelle bekommen Business-Anwender und Datenexperten gleichermaßen Zugang zu Datensets und können sie untersuchen, vorbereiten und für Analysezwecke anreichern. Außerdem können Anwender auf allen technischen Ebenen damit wertvolle Dateneinsichten generieren.
„Akkurate Datenbestände, die für KI geeignet sind, eröffnen eine ganze Reihe neuer Geschäftsmöglichkeiten“, erklärt Dumisani Mthimkhulu, Head of Data Asset Management Platforms, bei der Standard Bank of South Africa Limited. „Wir können jetzt strategische Entscheidungen darauf aufbauen und unsere Datenexperten entwickeln wirklich interessante und rentable Modelle damit.“
„Viele Unternehmen versuchen gerade, ihre Daten für die strategische Entscheidungsfindung zu nutzen. Aber Analyse, maschinelles Lernen und KI-Projekte werden oft von schlechter Datenqualität behindert und von ineffizienter Datenaufbereitung sowie mangelnder Steuerung verzögert“, sagt Adam Wilson, CEO von Trifacta. „Wir freuen uns, mit dem Self-Service-Ansatz von Trifacta unseren Beitrag zur innovativen IBM InfoSphere leisten zu können und mit Watson viele Anwender in IBMs Ökosystem zu erreichen. Diese Zusammenarbeit wird Unternehmen dazu befähigen, ihre Datenvorbereitung mit Self-Service Analytics zu optimieren – in einer überwachten und zentral verwalteten Umgebung.”


Das könnte Sie auch interessieren