16.04.2013, 00:00 Uhr
Massiv parallel mit der Programmiersprache R
EXASOL, Spezialist für In-Memory Datenbanken, unterstützt mit EXASolution künftig die Programmiersprache R für statistische Berechnungen.
Durch die Kombination aus R -- einer Programmiersprache für Datenwissenschaftler und Geschäftsanalysen -- und EXASolution ergeben sich für Data Scientists und anderen Analysespezialisten unter anderem aus den Branchen Handel, Produktion und Marktforschung erhebliche Vorteile: Es werden keine teuren Rechnerressourcen für Analysen benötigt, die Daten von einem ins andere System transferieren. Da EXASolution linear skalieren kann, laufen Analysen auch auf sehr großen Datenmengen in nur einem Bruchteil der bisher benötigten Zeit ab. Nicht zuletzt ermöglicht die parallele Ausführung des R-Codes in EXASolution eine extrem hohe Performance von Abfragen.
R ist eine Open-Source-Software zur Datenanalyse und Visualisierung. 1993 an der Universität von Auckland in Neuseeland entwickelt, steht R für einen völlig neuartigen Ansatz, mit Daten aller Art umzugehen. R bietet eine Vielzahl von statistischen Methoden (lineare und nichtlineare Modellierung, klassische statistische Testverfahren, Zeitreihenanalyse, Clusteranalysen etc.) und Werkzeuge zur grafischen Visualisierung. Dabei ist R in höchstem Maße erweiterbar. Eine der Stärken von R ist die Flexibilität: R-Experten können mit dem gleichen Code, den gleichen Tools und dem gleichen Know-how sowohl Big Data als auch kleinere Studien analysieren, Text-Mining wie auch Regressionsanalysen durchführen. Standardeinstellungen liefern schon sehr gute Ergebnisse, sämtliche Algorithmen bleiben dem Benutzer jederzeit erhalten. R wird weltweit von schätzungsweise 2 Millionen Nutzern in Unternehmen und Wissenschaft genutzt. Die Community hat mehr als 2.500 Pakete entwickelt, die Bausteine zur Erstellung analytischer Modelle darstellen. [bl]