21.08.2014, 00:00 Uhr
Big-Data-Lösung für die Forschung
DESY und IBM haben eine Kooperation zur Entwicklung einer hochperformanten Big-Data-Speicherlösung für die Forschung geschlossen. DESY setzt dazu ein IBM-Speichersystem ein, das große Datenmengen extrem schnell handhaben kann. Zu Spitzenzeiten sollen bis zu 20 Gigabyte pro Sekunde verarbeitet werden.
Die Daten entstehen an DESYs Forschungslichtquelle PETRA III. Ihr hochbrillantes Röntgenlicht liefert Wissenschaftlern einzigartige Einblicke in den Nanokosmos -- von neuartigen Halbleitern über Katalysatormaterialien bis hin zu lebenden Zellen. PETRA III ist ein 2,3 Kilometer langer Ringbeschleuniger, der elektrisch geladene Teilchen nahezu mit Lichtgeschwindigkeit durch spezielle magnetische Slalomstrecken schickt, um auf diese Weise intensive Röntgenstrahlung zu erzeugen.
Mehr als 2000 Forscher pro Jahr erkunden mit diesem Licht atomgenau die innere Struktur ihrer Proben, wobei enorme Datenmengen entstehen. "Ein typischer Detektor liefert heute einen Datenstrom von etwa fünf Gigabit pro Sekunde", erläutert der Leiter der DESY-IT, Dr. Volker Gülzow. Das entspricht knapp einer CD-ROM pro Sekunde. "An PETRA III steht aber nicht nur ein Detektor, sondern es gibt 14 Messstationen, die zurzeit auf 24 erweitert werden. Alle diese Daten müssen zuverlässig gespeichert und verarbeitet werden."
Um diese Herausforderung zu meistern, entwickeln DESY und IBM Research eine Lösung auf Basis des IBM-Systems Software-Defined-Storage mit dem Codenamen Elastic Storage (1). Diese nach oben skalierbare Lösung soll die bis zu 20 Gigabyte Daten, die pro Sekunde an den PETRA-III-Messstationen erzeugt werden, speichern und für die Analyse vorhalten. So sollen Forscher schnelleren Zugang zu ihren Messdaten bekommen. DESY kann auf diese Weise Analysis-as-a-Service und Cloud-Dienste für die Nutzer seiner Anlagen aus aller Welt anbieten.
Die Skalierbarkeit des Systems soll auch bei künftigen Herausforderungen bei der Verarbeitung von Forschungsdaten helfen. Mit dem europäischen Röntgenlaser European XFEL bauen DESY und internationale Partner derzeit eine Forschungslichtquelle, die noch sehr viel mehr Daten produzieren wird als PETRA III. "Wir erwarten vom European XFEL etwa 100 Petabyte pro Jahr, also 100 Millionen Gigabyte", erläutert Gülzow. Das ist vergleichbar mit dem Datenvolumen des weltgrößten Teilchenbeschleunigers LHC (Large Hadron Collider) am europäischen Teilchenforschungszentrum CERN bei Genf.
(1) In der IT vollzieht sich gerade ein Wandel von Hardware-basierten zu Software-basierten Lösungen (Stichwort: Software Defined Systems). Elastic Storage ist eine Software-basierte Storage-Lösung für File- und Objektdaten, die die anspruchsvollen Anforderungen von DESY unterstützt. Elastic Storage ist hochskalierbar und flexibel.
[bl]