Pressemitteilung: Microsoft übernimmt den Open Source R-Spezialisten Revolution Analytics

Kassel, 27.01.15. Microsoft hat mit Revolution Analytics einen der führenden R-Spezialisten übernommen. Zwei eoda Partner bündeln ihre Kräfte und stellen interessante Optionen für Big Data in Aussicht. R ist eine der beliebtesten Programmiersprachen für statistische Datenanalyse mit über 6.000 Erweiterungspaketen, die in allen Branchen und Anwendungsbereichen von der Absatzprognose über die Gendatenanalyse bis zur Portfoliooptimierung genutzt wird und gewissermaßen die Lingua franca in der Community der Data Scientists ist. Im letzten Tiobe-Index im November kletterte R auf Platz 12 der populärsten Programmiersprachen. Revolution Analytics bietet Professional Services und kommerziellen Support für R und unterstützt mehrere Open-Source-R-Projekte, darunter ParallelR, das die Parallelisierung von R Scripten bzw. Algorithmen ermöglicht oder RHadoop, das die Ausführung von R-Code auf Hadoop Clustern erleichtert. Mit Paketen wie ScaleR, DistributedR und ConnectR bietet Revolution Analytics auch kommerzielle Pakete im Rahmen von „Revolution R Enterprise“ an, die die Performance von komplizierten Algorithmen in R auf großen Datenbeständen erhöhen. Hierzu hat Revolution Analytics mit dem XDF-Format auch ein eigenes File Format entwickelt.

Die Zusammenarbeit von Revolution Analytics und Microsoft besteht auf der technischen Ebene schon länger. Schon seit Jahren kann man aus der Revolution Analytics IDE den „Compute Context“ auf Azure umstellen und mit R auf der Microsoft Cloud rechnen. Mit Azure ML hat Microsoft kürzlich ein Framework zur Datenanalyse auf Azure vorgestellt, in dem R eingebunden ist.
Andere Datenbankanbieter haben sich schon länger zu R positioniert. So ist R beispielsweise eine der Analysesprachen für die In Memory Datenbank HANA von SAP. Oracle bietet mit Oracle R Enterprise einen Konnektor für R an, der In-Database-Analysen ermöglicht. Auch nahezu alle anderen Hersteller wie zum Beispiel Teradata oder Exasol bieten Integrationslösungen für R an.

Logischer Schritt und spannender Ausblick

„Der Schritt ist aus der Sicht beider Unternehmen logisch“, kommentiert Heiko Miertzsch, CEO des deutschen R-Spezialisten eoda, Partner von Microsoft und Revolution Analytics, den Schritt: „Microsoft war beim Thema R gegenüber den direkten Wettbewerbern immer etwas spät dran und Revolution Analytics allein auf Dauer wohl zu klein, um im zunehmend wettbewerbsintensiven Big Data Markt ganz vorne mitzuspielen. Microsoft hat eine gefüllte Kriegskasse und Revolution Analytics sehr viel Know-How und interessante Lösungen und Services zu R sowie eine breite Kundenbasis. Beide Unternehmen arbeiten bereits länger zusammen und haben mit Hortonworks einen gemeinsamen strategischen Partner für Hadoop, eine zunehmend wichtige technologische Plattform.“
Ein weiterer Aspekt der Zusammenarbeit dürfte auch die R-Community sein. R zieht weltweit eine riesige Entwicklergemeinde an, die Lösungen für Analytics mit R entwickeln und Revolution Analytics unterstützt 150 User Groups weltweit.

Mit Spannung dürfen Microsoft-Kunden und R-Nutzer nun abwarten, was als nächstes folgt. Mit R.NET kündigt sich bereits eine interessante Integrationsschicht zwischen R und der Microsoft-Welt an. „Bei vielen unseren Kunden wird Open Source R gewissermaßen heimlich betrieben, weil die Verantwortlichen Haftungsfragen im Open Source Umfeld scheuen. Der Name Microsoft und entsprechende Angebote könnten hier helfen. Wir stehen in jedem Fall bereit, unsere Kunden bei der bestmöglichen Integration und Nutzung von R zu unterstützen und werden die Entwicklung verfolgen“, fasst Miertzsch die Bedeutung der Übernahme zusammen.

Design of Experiments mit R als Fundament für richtige Entscheidungen

„In the world of the hippo (highest paid person’s opinion), you ask the chief designer or the marketing director to pick a blue and that’s the solution. In the world of data you can run experiments to find the right answer.“  (Dan Cobley – Ehemaliger Marketing Direktor bei Google)

Immer mehr Unternehmen setzen auf datengestützte Entscheidungsprozesse, um ihre Produkte und Abläufe zu optimieren. So untersuchte der Marktführer Google während des Experimentes „50 shades of blue“ die Auswirkung verschiedener Blautöne von Werbeanzeigen auf das Klickverhalten der Benutzer. Die Methode des Design of Experiments (DoE) ist über alle Branchen hinweg längst nicht nur bei Google ein wichtiger Faktor, um wertvolle Erkenntnisse über Kunden, Produkte und Technologien zu erhalten.

Ziel: Maximale Effizienz bei minimalen Kosten

Die Grundzüge der statistischen Versuchsplanung reichen bereits bis ins 18. Jahrhundert zurück: Die Untersuchung der Wirksamkeit unterschiedlicher Behandlungsmethoden sollte die Seefahrerkrankheit Skorbut lindern. Bis heute gleich geblieben ist die methodische Zielsetzung von DoE: Die Zahl der Experimente, die zur Bestimmung von Parametereinflüssen auf ein untersuchtes Merkmal nötig sind, werden durch vereinfachende Annahmen und statistische Auswertungsverfahren auf ein Minimum reduziert. Gewandelt haben sich hingegen die Anwendungsfelder von DoE.

DoE gibt Orientierung bei Entscheidungen

Das sich stetig verändernde Kundenverhalten und die komplexen Einflüsse darauf haben den Markt verändert. Statistische Auswertungen können bislang unbekannte Zusammenhänge zwischen Input und Output aufdecken und so das Entscheidungsrisiko senken. Das höhere Verständnis für die Bedürfnisse von Endverbrauchern ermöglicht die Entwicklung von am Markt erfolgreichen Produkten und die Vermeidung von kostspieligen Fehltritten aufgrund von individuellen Fehleinschätzungen. Statistische Erhebungen ersetzen nicht die bisherigen Entscheidungsstrukturen, aber sie ergänzen sie und ermöglichen die präzise Quantifizierung von Einflüssen.

Weiterlesen

Spatial visualization with R – Tutorial

The visualization of spatial data is one of the most popular applications when using R. This tutorial is an introduction to the visualization of spatial data and creation of geographic maps with R.

Spatial Visualisation with R

Spatial Visualisation with R

The focus will be on the following subjects:

  • Import and use of shapefiles in R (the shapefile is a file format designed for spatial data).
  • Data management and restructuring of data.
  • The creation of maps.
  • Visualization of data on maps.
  • Enrichment of created maps using the spatial information of static maps from OpenStreetMap.de.

 

This tutorial shows the creation of a map of the different districts of Kassel including the number of households within each district. This type of map is also known as Choropleth map. Going even further, this map will also contain the stations of the Kassel bicycle sharing system “Konrad”.

 

Weiterlesen

Tutorial: Kartenvisualisierung mit R

Die Visualisierung von Regional- und Geodaten ist eines der gefragtesten Themen im Umfeld von R. Das folgende Tutorial gibt einen Einblick in die Kartenvisualisierung mit der freien Programmiersprache.

Beispiel einer Kartenvisualisierung mit R

Beispiel einer Kartenvisualisierung mit R

Behandelt werden folgende Themen:

  • Einlesen und Umgang mit Shapefiles in R (Shapefile ist ein Speicherformat speziell für Geodaten).
  • Datenmanagement bzw. Umstrukturieren von Datensätzen
  • Visualisierung von Daten auf einer Karte
  • Anreichern einer Karte mit weiteren Inhalten von openstreetmap.de.

Das Tutorial zeigt die Erstellung einer Karte der Kasseler Stadtbezirke einschließlich der grafischen Darstellung der dort ansässigen Haushalte. Solch ein Kartentyp wird auch als Choropleth Karte bezeichnet. In einem weiteren Schritt werden zusätzlich Stationen des Kasseler Fahrradverleihsystems Konrad eingezeichnet.

Weiterlesen

eoda erweitert das beliebte deutschsprachige R-Schulungsprogramm für den professionellen Einsatz

Der Kasseler Datenanalysespezialist eoda stellt das neue Kursprogramm der R-Akademie für das Jahr 2015 vor. Die eoda R-Akademie ist ein umfassendes deutschsprachiges  Schulungsprogramm für die freie Statistiksprache R. Seit 2011 befähigt eoda mit seinem etablierten Trainingsprogramm Anwender dazu, dass nahezu unbegrenzte analytische Potential von R für sich zu nutzen.

Neue Kurse für den professionellen Einsatz von R im Unternehmenskontext

Mit dem Anspruch Interessenten ein möglichst ganzheitliches Kursangebot rund um die Themen R und Datenanalyse anzubieten hat eoda die R-Akademie für das kommende Jahr nochmals weiterentwickelt. Das bedeutet, dass neben den bewährten Modulen neue Kurs entstanden sind, die das bereits bestehende Angebot der R-Akademie abrunden. „R entwickelt sich zunehmend zur plattformübergreifenden Lingua franca für Datenanalysten. Dies hat zur Folge, dass die Nutzerzahlen stetig steigen und damit einhergehend R immer häufiger auch in Deutschland im Unternehmensumfeld zum Einsatz kommt. Die dadurch entstehenden besonderen Anforderungen hinsichtlich Reproduzierbarkeit, Teamarbeit oder Kompatibilität haben wir bei der Konzeption unseres neuen Kursprogramms aufgegriffen.“ erklärt Heiko Miertzsch, Geschäftsführer von eoda, die Vorteile des neuen Angebotes für die Teilnehmer.

Der Aufbau der eoda R-Akademie 2015

Der Aufbau der eoda R-Akademie 2015

Konkret wird die R-Akademie 2015 um fünf Kurse erweitert:

  • Multivariate Statistik mit R II
  • Paketerstellung in R
  • R im produktiven Unternehmensumfeld
  • Datenmanagement mit R
  • Werbewirkungsanalyse mit R

Weiterlesen

eoda vertreibt RStudio-Produkte in Europa und unterstützt Anwender mit Beratung und Training.

  • RStudio ist die beliebteste Entwicklungsumgebung für R-Anfänger und Profis
  • Interaktive webbasierte R-Anwendungen mit Shiny entwickeln

Der Datenanalysespezialist eoda und RStudio, Anbieter der populären gleichnamigen Entwicklungsumgebung für die quelloffene Datenanalyse-Software „R“, geben ihre Partnerschaft bekannt.

Partnerschaft zwischen RStudio und eoda

Partnerschaft zwischen RStudio und eoda

Der Erfolg von R beruht auf der Synergie einer engagierten und weltweit vernetzten wissenschaftlichen Community und dem Engagement nahezu aller kommerziellen Anbieter von Datenbank- oder BI-Produkten. RStudio gelingt es, das Momentum der Community mit den Anforderungen professioneller Anwender zu verbinden. Exemplarisch dafür steht Hadley Wickham, einer der führenden Köpfe der R-Community, der von RStudio als Chief Scientist gewonnen werden konnte.

Neben dem Kernprodukt, einer Entwicklungsumgebung für R, veröffentlicht RStudio zahlreiche freie Software-Pakete zu den Themen Datenmanagement (reshape2, plyr, dplyr), Paketverwaltung (packrat), Code-Dokumentation (roxigen), Visualisierung (ggplot2, ggvis) und Reproducible Research (knitr und R Markdown). RStudio gehört damit zu den wichtigsten Wegbereitern der professionellen Verwendung von R im Unternehmensumfeld.

Weiterlesen

translate2R: Migrate SPSS scripts to R at the push of a button

After their presentation at the international “user!” conference, data analysis specialist eoda starts the public alpha testing of translate2R. With the start of alpha testing the innovative migration solution by the company hailing from Kassel discards the working title “translateR” and takes on the final product brand name “translate2R”. translate2R is a service for the automated translation of SPSS® syntax to R code, therefore supporting data analysts with a quick and low-risk migration to R.

The manual translation of many, frequently rather complex SPSS scripts often presents itself as a tedious and error-prone task, and represents a rather large obstacle for many analysts and companies to migrate to a modern, open source data management and analysis tool like R. With translate2R this hurdle will be diminished substantially. “Many companies have recognized the advantages of R. Still, old scripts with thousands of rows of code in other statistics languages pose a large barrier and an almost incalculable risk when migrating to R. translate2R will help limiting this risk distinctively”, Oliver Bracht, CTO of eoda, explains the value of translate2R for users.

translate2R: user friendly and intuitive

translate2R, developed by a cooperation between eoda and the University of Kassel and sponsored by the LOEWE program of the German state of Hesse, will be provided as both, a cloud service and on premise. The translation will be processed in two steps for the user: first, the SPSS syntax will be imported into the user friendly browser frontend of translate2R, then the corresponding R functions will be generated by the push of a button. Finally, the generated code will be executed in R. The accompanying R package translateSPSS2R contains all required functions for the code to run appropriately and is compatible will almost every possible installation of R. Besides migration projects to R, translate2R also support programmers who are firm with SPSS and who are looking for a comforting introduction into R. Vice versa, translate2R also enables users to comfortably implement common SPSS functions in R.

The user friendly browser frontend of translate2R.

The user friendly browser frontend of translate2R.

Weiterlesen

translate2R: SPSS Skripte auf Knopfdruck nach R migrieren

Nach der Präsentation auf der internationalen „useR!“ Conference geht der Datenanalysespezialist eoda mit translate2R in den öffentlichen Alpha Test. Zum Start der Alpha Testphase legt die innovative Migrationslösung des Kasseler Unternehmens den Arbeitstitel „translateR“ ab und trägt ab sofort die finale Produktbezeichnung „translate2R“. translate2R ist ein Dienst zur automatischen Übersetzung von SPSS® Syntax in R Code. Damit unterstützt translate2R Datenanalysten bei einer schnellen und risikoarmen Migration nach R.

Die manuelle Übersetzung vieler oft komplexer SPSS Skripte als langwierige und fehleranfällige Aufgabe stellt für zahlreiche Analysten und Unternehmen eine große Hürde dar, den Wechsel auf ein modernes freies Datenmanagement- und Analysetool wie R zu vollziehen. Mit translate2R wird diese Hürde entscheidend abgebaut. „Viele Unternehmen haben die Vorteile von R erkannt. Alte Skripte mit tausenden Zeilen SPSS Code stellen bei der Migration nach R eine Hürde und ein schwer kalkulierbares Kostenrisiko dar. translate2R hilft hier entscheidend das Risiko zu begrenzen “ erklärt Oliver Bracht, CTO bei eoda, den Nutzen von translate2R für die Anwender.

translate2R: Anwenderfreundlich und intuitiv nutzbar

translate2R, entwickelt in einer durch das LOEWE-Programm des Landes Hessen geförderten Kooperation von eoda und der Universität Kassel, soll zukünftig sowohl als Cloudservice, als auch als On-Premise Variante verfügbar sein. Die Übersetzung vollzieht sich für den User in zwei Schritten. Zunächst wird SPSS-Syntax in das anwenderfreundliche Browserfrontend von translate2R importiert, wo auf Knopfdruck die entsprechenden R-Funktionen generiert werden. Anschließend wird der entstandene Code in R ausgeführt. Alle dafür notwendigen Funktionen sind in dem Paket translateSPSS2R gebündelt und somit auf nahezu jeder R-Installation lauffähig. Neben Migrationsprojekten nach R unterstützt translate2R auch Programmierer, die mit SPSS® vertraut sind, und einen unkomplizierten Einstieg in R suchen. Umgekehrt ermöglicht translate2R Usern die komfortable Einbindung gewohnter SPSS Funktionen in R.

Das benutzerfreundliche Browserfrontend der automatischen Migrationslösung translate2R

Das benutzerfreundliche Browserfrontend der automatischen Migrationslösung translate2R

Weiterlesen

Statistische Prozesskontrolle als Grundlage optimalen Qualitätsmanagements

  • Potenziale erschließen durch die Integration der leistungsfähigen Programmiersprache
  • Training zur angewandten Statistik im Qualitätsmanagement vom 2. bis 4. Dezember

In Zeiten immer dynamischer werdender Produktionsabläufe und Prozesse gewinnt das Qualitätsmanagement stetig an Bedeutung.

Systematisch durchgeführte statistische Kontrollen in Liefer- und Fertigungskette sowie Prozessmonitoring im Sinne von Six Sigma können dabei helfen, Ausfallraten zu minimieren, die Produktqualität zu steigern und damit die Kundenzufriedenheit zu erhöhen.

Die Verringerung von Warenrücknahmen, sicheres Prozessmanagement und ein verbessertes Unternehmensimage sind positive Auswirkungen eines zuverlässigen Qualitätsmanagements auf die Unternehmensperformance.

Unzureichendes statistisches Know-how im Qualitätsmanagement als Risikofaktor

Im Gegensatz dazu stellen beispielsweise unzureichend geprüfte Wareneingänge und Analysen von Prozesskennzahlen ein unkalkulierbares Risiko dar. Innerhalb der Supply-Chain und über den gesamten Produktionsprozess hinweg können nicht angemessene Kontrollen immense Kosten verursachen.

Ein durchdachter Prüfplan zur Qualitätsbewertung und –kontrolle trägt hier erheblich zur Risikominimierung durch eine frühzeitige Fehlererkennung bei. Zusätzlich entsteht durch die detaillierte Dokumentation der Prüfungen die Grundlage für belastbare Argumente gegenüber den Vertragspartnern.

Weiterlesen

tableR vereinfacht die Prozesse von Marktforschern und Analysten

tableR ist eine neue Software von eoda, die den gesamten Prozess von der Erstellung des Fragebogens bis zur fertigen Ergebnispräsentation ohne Medienbrüche unterstützt. Ohne Programmierkenntnisse können Anwender Fragebögen entwerfen, Rohdaten auswerten und Tabellen sowie Grafiken erstellen.

Heterogene Toollandschaft führt oft zu Fehlern und hohen Prozesskosten

Die Auswertung von Daten ist oftmals gekennzeichnet durch Medienbrüche und manuelle Arbeitsschritte. Meist wird verschiedenartige Software für einzelne Prozessvorgänge genutzt. Damit sind notwendigerweise manuelle Transformationsschritte verbunden, die zu hoher Fehleranfälligkeit, zeitlichen Verzögerungen und unnötigen Kosten führen. Ineffizienzen, Qualitätsprobleme, zu lange Projektlaufzeiten und unzufriedene Kunden sind regelmäßig die Konsequenz. Gefördert durch das LOEWE-Programm des Landes Hessen, bietet eoda Marktforschern und allen, die regelmäßig Daten auswerten, eine Software, die die Prozesseffizienz dauerhaft steigert.

tableR: Fragebögen, Auswertungen, Tabellen und Grafiken in einem Tool

Mit tableR können Benutzer Fragebögen erstellen und diese sowohl als Office-Dokument exportieren, als auch mit Hilfe eines strukturierten XMLs zu einem Onlinefragebogen weiterverarbeiten. Der Fragebogen dient dabei außerdem als strukturierte Repräsentation der zu importierenden Rohdaten. Auf dieser Basis lässt sich mit einem Klick ein fertiger Report anfertigen, der vielfältig individualisiert werden kann. Die erstellten Tabellen und Grafiken können nach Office (Word, Excel, PowerPoint) und HTML exportiert werden. tableR bietet einen reproduzierbaren Ablauf. Dabei entsteht das zur Auswertung notwendige Skript automatisch im Hintergrund. Neben der Anwendung in der klassischen Marktforschung hat tableR ein vielfältiges Einsatzpotential, so können beispielweise beliebige strukturierte Datensätze eingelesen und analysiert werden. Weitere Analysemöglichkeiten sind durch die Integration der freien Statistiksprache R nahezu grenzenlos.

Diese Diashow benötigt JavaScript.

Beta-Test ermöglicht exklusive Einblicke in die Entwicklung von tableR

eoda startet ab dem 15. September einen Beta-Test für tableR. Interessierte können sich unter www.eoda.de/de/tabler.html registrieren. Teilnehmer des Beta-Tests haben die Möglichkeit, ihre Wünsche und Anregungen in die finalen Entwicklungsschritte von tableR einfließen zu lassen und so die Weiterentwicklung zu beeinflussen.