Databricks, MLflow
16.10.2019, 09:07 Uhr
Model Management mit MLflow Model Registry
MLflow bietet seinen Benutzern jetzt ein zentrales Repository, um das maschinelle Lernen zu beschleunigen.
Databricks, Entwickler von Apache Spark und Anbieter von Unified Analytics, hat die Funktion Model Registry für sein Produkt MLflow angündigt. Das neue Feature in der Open-Source-Plattform für den Lebenszyklus des Machine Learnings (ML) soll einen effizienteren Modellmanagementprozess ermöglichen, indem es Data Scientists und Data Engineers ein zentrales Repository zur Verfügung stellt, um maschinelle Lernmodelle zu verfolgen, zu teilen und zu speichern. Letztlich wird über ihren Lebenszyklus vom Experiment bis zur Produktion alles verwaltet. Seit der Einführung von MLflow auf dem Spark+AI Summit 2018 verzeichnete das Projekt mehr als 140 Beiträge und 800.000 monatliche Downloads.
„Jeder, der versucht hat, die Entwicklung von Machine Learning voranzutreiben, weiß, dass dies eine komplexe Angelegenheit ist. Die Möglichkeit, Modelle zu verfolgen, ist entscheidend, um Verwirrung zu vermeiden, da die Anzahl der Modelle in der Experimentier-, Test- und Produktionsphase zu einem bestimmten Zeitpunkt in die Tausende gehen kann“, sagt Matei Zaharia, Chief Technologist bei Databricks. „Die neuesten Innovationen in MLflow, die von Hunderten von Entwicklern geschaffen wurden, ermöglichen es Unternehmen weltweit, die Entwicklung und Bereitstellung von ML-Modellen während des gesamten Lebenszyklus zu verbessern. Mit Hunderttausenden von monatlichen Downloads werden wir ermutigt, dass die Beiträge der Community einen positiven Effekt erzielen.“
Das aktuelle MLflow-Angebot ist laut Databricks bereits in der Lage, Experimente und Artefakte zu protokollieren, Modelle zu verpacken und Abläufe zu reproduzieren. Darüber hinaus stellt es flexible Bereitstellungsoptionen innerhalb der Plattform oder aller Cloud-Inferenzdienste oder Container bereit. Die MLflow Model Registry baut auf diesen Fähigkeiten auf, indem sie es Unternehmen ermöglicht, Modelle zu speichern und den Entwicklungslebenszyklus von ML-Modellen zu optimieren. Dies alles geschieht, während sie von der Anmeldung bis zur tatsächlichen Bereitstellung alle Prozesse durchlaufen:
- Ein kollaboratives Zentrum: Die MLflow Model Registry erleichtert den Austausch von Fachwissen und Wissen über den Aufbau und die Bereitstellung von Modellen für das Machine Learning in Entwicklungsteams, indem sie Modelle auffindbarer macht und kollaborative Funktionen bereitstellt, um zusammen gemeinsame ML-Aufgaben zu verbessern.
- Flexible CI/CD-Pipelines: Model Registry ermöglicht es Teams, die Kontrolle über Modelle für Machine Learning zu behalten, indem sie entweder automatisch ein Modell basierend auf vordefinierten Bedingungen in die Produktion überführen oder Änderungen in der Lebenszyklusphase für ihre Modelle von der Experimentierphase über das Testen bis hin zur Produktion manuell steuern und validieren.
- Einblick in den Lebenszyklus von Modellen: Große Unternehmen haben oft Tausende von ML-Modellen in der Experimentier-, Test- und Produktionsphase zu jedem Zeitpunkt. Die MLflow Model Registry bietet vollständige Transparenz und ermöglicht die Steuerung jedes einzelnen, indem sie die Modellhistorie verfolgt und verwaltet, wer Änderungen genehmigen kann.
Weitere Informationen zu MLflow finden Sie hier.