Pressemitteilung: Implementierung von SPSS-Funktionen in R mit translate2R und translateSPSS2R von eoda

Kassel, 12.02.2015: In einem vergangenen Blogbeitrag  hat eoda bereits  die Hauptgründe für translate2R sowie seine Vorteile erläutert. Jetzt will der Kasseler Datenanalyst detaillierter auf die Funktionsweise der neuartigen Migrationslösung eingehen. Im Fokus steht dabei auch das zugehörige R-Paket translateSPSS2R. Außerdem will eoda die Beweggründe aufzeigen, die zur Entwicklung einer Migrationslösung von SPSS nach R geführt haben.

Wieso kommt für Anwender eine Migration von SPSS nach R in Frage?

Zahlreiche Unternehmen und öffentliche Einrichtungen nutzen SPSS. Viele davon erwägen aber einen Wechsel hin zu modernen Analyse Technologien.

Von einigen Alternativen zu SPSS ist R die vielversprechendste: Eng verknüpft mit der weltweiten Data Science Community gewährleistet R die Verfügbarkeit der aktuellsten Methoden zur Datenanalyse. Mit der stetig wachsenden Anzahl an zusätzlichen Erweiterungspaketen ist R in puncto Funktionsumfang und Flexibilität führend. R ist Open Source und im Gegensatz zu anderen Analyselösungen lizenzkostenfrei.  Einen umfassenden Überblick über die Vorteile von R finden Interessierte hier.

translate2R ebnet auf Knopfdruck den Weg zu R

Die Übersetzung tausender komplexer Zeilen SPSS-Code in R kann mit einigen Komplikationen verbunden sein. Der mit einer Migration verbundene Aufwand ist erheblich und im Vorfeld schwer abzuschätzen. Eine manuelle Übersetzung ist fehleranfällig und die Erstellung eines funktionell äquivalenten R-Skriptes wegen der Unterschiede zwischen den beiden Sprachen kompliziert. Der manuelle Vergleich zwischen migrierten und originalen Skript und die Vermeidung von Inkonsistenzen sind schwer umzusetzen.

Weiterlesen

translate2R web front end, left side previously described SPSS source code, right side R code output

translate2R and translateSPSS2R: Implanting SPSS functionality into R

In this blog article from October 2014, we gave a brief introduction to translate2R explaining the main reasons for as well as advantages of translate2R. Now, we want to showcase the inner workings of this migration process with a focus on the R environment and the respective R package translateSPSS2R. Furthermore, we will also show the motivation for providing the data science community with a one click solution for migrating from SPSS to R.

General Motivation – Why would someone consider transferring from SPSS to R?

Companies and public institutions still work with SPSS but many of them might consider transferring to state-of-the-art analytic technologies.
There are quite a few alternatives to SPSS, but to us the most promising might be the R statistic language: its tightly knit relationship with the data science community will always ensure an unprecedented contemporariness setting it apart from other analytical solutions. Additionally, the ever growing number of extension packages makes R the most flexible data-science environment which covers an expanding scope of analytical functions. Since R is open source, this comes essentially without any licensing costs. A comprehensive overview of the advantages of R can be found here.

translate2R – one click lowers the threshold of change

There are certain complications when someone tries to translate tens of thousands lines of code from SPSS to R. First of all, the effort required is significant and hard to estimate in advance. Furthermore, a manual translation is error prone and writing functionally equivalent R script might prove to be a rather complex task due to the differences in attributes in the two languages for example. It is difficult to compare the migrated script against the original code and challenging to debug the migrated script in case of any inconsistencies. Plus, translate2R can also support proof-of-concept projects regarding the migration of proven SPSS code to R.

PSPP Syntaxeditor mit Beispielcode

PSPP Syntax Editor, programming Editor of pspp with example source code

Translate2R aims at solving this problem by automatizing the gross of this workload – one button translates the majority of SPSS code into a fully functional R script.

Weiterlesen

Pressemitteilung: Microsoft übernimmt den Open Source R-Spezialisten Revolution Analytics

Kassel, 27.01.15. Microsoft hat mit Revolution Analytics einen der führenden R-Spezialisten übernommen. Zwei eoda Partner bündeln ihre Kräfte und stellen interessante Optionen für Big Data in Aussicht. R ist eine der beliebtesten Programmiersprachen für statistische Datenanalyse mit über 6.000 Erweiterungspaketen, die in allen Branchen und Anwendungsbereichen von der Absatzprognose über die Gendatenanalyse bis zur Portfoliooptimierung genutzt wird und gewissermaßen die Lingua franca in der Community der Data Scientists ist. Im letzten Tiobe-Index im November kletterte R auf Platz 12 der populärsten Programmiersprachen. Revolution Analytics bietet Professional Services und kommerziellen Support für R und unterstützt mehrere Open-Source-R-Projekte, darunter ParallelR, das die Parallelisierung von R Scripten bzw. Algorithmen ermöglicht oder RHadoop, das die Ausführung von R-Code auf Hadoop Clustern erleichtert. Mit Paketen wie ScaleR, DistributedR und ConnectR bietet Revolution Analytics auch kommerzielle Pakete im Rahmen von „Revolution R Enterprise“ an, die die Performance von komplizierten Algorithmen in R auf großen Datenbeständen erhöhen. Hierzu hat Revolution Analytics mit dem XDF-Format auch ein eigenes File Format entwickelt.

Die Zusammenarbeit von Revolution Analytics und Microsoft besteht auf der technischen Ebene schon länger. Schon seit Jahren kann man aus der Revolution Analytics IDE den „Compute Context“ auf Azure umstellen und mit R auf der Microsoft Cloud rechnen. Mit Azure ML hat Microsoft kürzlich ein Framework zur Datenanalyse auf Azure vorgestellt, in dem R eingebunden ist.
Andere Datenbankanbieter haben sich schon länger zu R positioniert. So ist R beispielsweise eine der Analysesprachen für die In Memory Datenbank HANA von SAP. Oracle bietet mit Oracle R Enterprise einen Konnektor für R an, der In-Database-Analysen ermöglicht. Auch nahezu alle anderen Hersteller wie zum Beispiel Teradata oder Exasol bieten Integrationslösungen für R an.

Logischer Schritt und spannender Ausblick

„Der Schritt ist aus der Sicht beider Unternehmen logisch“, kommentiert Heiko Miertzsch, CEO des deutschen R-Spezialisten eoda, Partner von Microsoft und Revolution Analytics, den Schritt: „Microsoft war beim Thema R gegenüber den direkten Wettbewerbern immer etwas spät dran und Revolution Analytics allein auf Dauer wohl zu klein, um im zunehmend wettbewerbsintensiven Big Data Markt ganz vorne mitzuspielen. Microsoft hat eine gefüllte Kriegskasse und Revolution Analytics sehr viel Know-How und interessante Lösungen und Services zu R sowie eine breite Kundenbasis. Beide Unternehmen arbeiten bereits länger zusammen und haben mit Hortonworks einen gemeinsamen strategischen Partner für Hadoop, eine zunehmend wichtige technologische Plattform.“
Ein weiterer Aspekt der Zusammenarbeit dürfte auch die R-Community sein. R zieht weltweit eine riesige Entwicklergemeinde an, die Lösungen für Analytics mit R entwickeln und Revolution Analytics unterstützt 150 User Groups weltweit.

Mit Spannung dürfen Microsoft-Kunden und R-Nutzer nun abwarten, was als nächstes folgt. Mit R.NET kündigt sich bereits eine interessante Integrationsschicht zwischen R und der Microsoft-Welt an. „Bei vielen unseren Kunden wird Open Source R gewissermaßen heimlich betrieben, weil die Verantwortlichen Haftungsfragen im Open Source Umfeld scheuen. Der Name Microsoft und entsprechende Angebote könnten hier helfen. Wir stehen in jedem Fall bereit, unsere Kunden bei der bestmöglichen Integration und Nutzung von R zu unterstützen und werden die Entwicklung verfolgen“, fasst Miertzsch die Bedeutung der Übernahme zusammen.

Design of Experiments mit R als Fundament für richtige Entscheidungen

„In the world of the hippo (highest paid person’s opinion), you ask the chief designer or the marketing director to pick a blue and that’s the solution. In the world of data you can run experiments to find the right answer.“  (Dan Cobley – Ehemaliger Marketing Direktor bei Google)

Immer mehr Unternehmen setzen auf datengestützte Entscheidungsprozesse, um ihre Produkte und Abläufe zu optimieren. So untersuchte der Marktführer Google während des Experimentes „50 shades of blue“ die Auswirkung verschiedener Blautöne von Werbeanzeigen auf das Klickverhalten der Benutzer. Die Methode des Design of Experiments (DoE) ist über alle Branchen hinweg längst nicht nur bei Google ein wichtiger Faktor, um wertvolle Erkenntnisse über Kunden, Produkte und Technologien zu erhalten.

Ziel: Maximale Effizienz bei minimalen Kosten

Die Grundzüge der statistischen Versuchsplanung reichen bereits bis ins 18. Jahrhundert zurück: Die Untersuchung der Wirksamkeit unterschiedlicher Behandlungsmethoden sollte die Seefahrerkrankheit Skorbut lindern. Bis heute gleich geblieben ist die methodische Zielsetzung von DoE: Die Zahl der Experimente, die zur Bestimmung von Parametereinflüssen auf ein untersuchtes Merkmal nötig sind, werden durch vereinfachende Annahmen und statistische Auswertungsverfahren auf ein Minimum reduziert. Gewandelt haben sich hingegen die Anwendungsfelder von DoE.

DoE gibt Orientierung bei Entscheidungen

Das sich stetig verändernde Kundenverhalten und die komplexen Einflüsse darauf haben den Markt verändert. Statistische Auswertungen können bislang unbekannte Zusammenhänge zwischen Input und Output aufdecken und so das Entscheidungsrisiko senken. Das höhere Verständnis für die Bedürfnisse von Endverbrauchern ermöglicht die Entwicklung von am Markt erfolgreichen Produkten und die Vermeidung von kostspieligen Fehltritten aufgrund von individuellen Fehleinschätzungen. Statistische Erhebungen ersetzen nicht die bisherigen Entscheidungsstrukturen, aber sie ergänzen sie und ermöglichen die präzise Quantifizierung von Einflüssen.

Weiterlesen

Spatial visualization with R – Tutorial

The visualization of spatial data is one of the most popular applications when using R. This tutorial is an introduction to the visualization of spatial data and creation of geographic maps with R.

Spatial Visualisation with R

Spatial Visualisation with R

The focus will be on the following subjects:

  • Import and use of shapefiles in R (the shapefile is a file format designed for spatial data).
  • Data management and restructuring of data.
  • The creation of maps.
  • Visualization of data on maps.
  • Enrichment of created maps using the spatial information of static maps from OpenStreetMap.de.

 

This tutorial shows the creation of a map of the different districts of Kassel including the number of households within each district. This type of map is also known as Choropleth map. Going even further, this map will also contain the stations of the Kassel bicycle sharing system “Konrad”.

 

Weiterlesen

Tutorial: Kartenvisualisierung mit R

Die Visualisierung von Regional- und Geodaten ist eines der gefragtesten Themen im Umfeld von R. Das folgende Tutorial gibt einen Einblick in die Kartenvisualisierung mit der freien Programmiersprache.

Beispiel einer Kartenvisualisierung mit R

Beispiel einer Kartenvisualisierung mit R

Behandelt werden folgende Themen:

  • Einlesen und Umgang mit Shapefiles in R (Shapefile ist ein Speicherformat speziell für Geodaten).
  • Datenmanagement bzw. Umstrukturieren von Datensätzen
  • Visualisierung von Daten auf einer Karte
  • Anreichern einer Karte mit weiteren Inhalten von openstreetmap.de.

Das Tutorial zeigt die Erstellung einer Karte der Kasseler Stadtbezirke einschließlich der grafischen Darstellung der dort ansässigen Haushalte. Solch ein Kartentyp wird auch als Choropleth Karte bezeichnet. In einem weiteren Schritt werden zusätzlich Stationen des Kasseler Fahrradverleihsystems Konrad eingezeichnet.

Weiterlesen

eoda erweitert das beliebte deutschsprachige R-Schulungsprogramm für den professionellen Einsatz

Der Kasseler Datenanalysespezialist eoda stellt das neue Kursprogramm der R-Akademie für das Jahr 2015 vor. Die eoda R-Akademie ist ein umfassendes deutschsprachiges  Schulungsprogramm für die freie Statistiksprache R. Seit 2011 befähigt eoda mit seinem etablierten Trainingsprogramm Anwender dazu, dass nahezu unbegrenzte analytische Potential von R für sich zu nutzen.

Neue Kurse für den professionellen Einsatz von R im Unternehmenskontext

Mit dem Anspruch Interessenten ein möglichst ganzheitliches Kursangebot rund um die Themen R und Datenanalyse anzubieten hat eoda die R-Akademie für das kommende Jahr nochmals weiterentwickelt. Das bedeutet, dass neben den bewährten Modulen neue Kurs entstanden sind, die das bereits bestehende Angebot der R-Akademie abrunden. „R entwickelt sich zunehmend zur plattformübergreifenden Lingua franca für Datenanalysten. Dies hat zur Folge, dass die Nutzerzahlen stetig steigen und damit einhergehend R immer häufiger auch in Deutschland im Unternehmensumfeld zum Einsatz kommt. Die dadurch entstehenden besonderen Anforderungen hinsichtlich Reproduzierbarkeit, Teamarbeit oder Kompatibilität haben wir bei der Konzeption unseres neuen Kursprogramms aufgegriffen.“ erklärt Heiko Miertzsch, Geschäftsführer von eoda, die Vorteile des neuen Angebotes für die Teilnehmer.

Der Aufbau der eoda R-Akademie 2015

Der Aufbau der eoda R-Akademie 2015

Konkret wird die R-Akademie 2015 um fünf Kurse erweitert:

  • Multivariate Statistik mit R II
  • Paketerstellung in R
  • R im produktiven Unternehmensumfeld
  • Datenmanagement mit R
  • Werbewirkungsanalyse mit R

Weiterlesen

eoda vertreibt RStudio-Produkte in Europa und unterstützt Anwender mit Beratung und Training.

  • RStudio ist die beliebteste Entwicklungsumgebung für R-Anfänger und Profis
  • Interaktive webbasierte R-Anwendungen mit Shiny entwickeln

Der Datenanalysespezialist eoda und RStudio, Anbieter der populären gleichnamigen Entwicklungsumgebung für die quelloffene Datenanalyse-Software „R“, geben ihre Partnerschaft bekannt.

Partnerschaft zwischen RStudio und eoda

Partnerschaft zwischen RStudio und eoda

Der Erfolg von R beruht auf der Synergie einer engagierten und weltweit vernetzten wissenschaftlichen Community und dem Engagement nahezu aller kommerziellen Anbieter von Datenbank- oder BI-Produkten. RStudio gelingt es, das Momentum der Community mit den Anforderungen professioneller Anwender zu verbinden. Exemplarisch dafür steht Hadley Wickham, einer der führenden Köpfe der R-Community, der von RStudio als Chief Scientist gewonnen werden konnte.

Neben dem Kernprodukt, einer Entwicklungsumgebung für R, veröffentlicht RStudio zahlreiche freie Software-Pakete zu den Themen Datenmanagement (reshape2, plyr, dplyr), Paketverwaltung (packrat), Code-Dokumentation (roxigen), Visualisierung (ggplot2, ggvis) und Reproducible Research (knitr und R Markdown). RStudio gehört damit zu den wichtigsten Wegbereitern der professionellen Verwendung von R im Unternehmensumfeld.

Weiterlesen

translate2R: Migrate SPSS scripts to R at the push of a button

After their presentation at the international “user!” conference, data analysis specialist eoda starts the public alpha testing of translate2R. With the start of alpha testing the innovative migration solution by the company hailing from Kassel discards the working title “translateR” and takes on the final product brand name “translate2R”. translate2R is a service for the automated translation of SPSS® syntax to R code, therefore supporting data analysts with a quick and low-risk migration to R.

The manual translation of many, frequently rather complex SPSS scripts often presents itself as a tedious and error-prone task, and represents a rather large obstacle for many analysts and companies to migrate to a modern, open source data management and analysis tool like R. With translate2R this hurdle will be diminished substantially. “Many companies have recognized the advantages of R. Still, old scripts with thousands of rows of code in other statistics languages pose a large barrier and an almost incalculable risk when migrating to R. translate2R will help limiting this risk distinctively”, Oliver Bracht, CTO of eoda, explains the value of translate2R for users.

translate2R: user friendly and intuitive

translate2R, developed by a cooperation between eoda and the University of Kassel and sponsored by the LOEWE program of the German state of Hesse, will be provided as both, a cloud service and on premise. The translation will be processed in two steps for the user: first, the SPSS syntax will be imported into the user friendly browser frontend of translate2R, then the corresponding R functions will be generated by the push of a button. Finally, the generated code will be executed in R. The accompanying R package translateSPSS2R contains all required functions for the code to run appropriately and is compatible will almost every possible installation of R. Besides migration projects to R, translate2R also support programmers who are firm with SPSS and who are looking for a comforting introduction into R. Vice versa, translate2R also enables users to comfortably implement common SPSS functions in R.

The user friendly browser frontend of translate2R.

The user friendly browser frontend of translate2R.

Weiterlesen

translate2R: SPSS Skripte auf Knopfdruck nach R migrieren

Nach der Präsentation auf der internationalen „useR!“ Conference geht der Datenanalysespezialist eoda mit translate2R in den öffentlichen Alpha Test. Zum Start der Alpha Testphase legt die innovative Migrationslösung des Kasseler Unternehmens den Arbeitstitel „translateR“ ab und trägt ab sofort die finale Produktbezeichnung „translate2R“. translate2R ist ein Dienst zur automatischen Übersetzung von SPSS® Syntax in R Code. Damit unterstützt translate2R Datenanalysten bei einer schnellen und risikoarmen Migration nach R.

Die manuelle Übersetzung vieler oft komplexer SPSS Skripte als langwierige und fehleranfällige Aufgabe stellt für zahlreiche Analysten und Unternehmen eine große Hürde dar, den Wechsel auf ein modernes freies Datenmanagement- und Analysetool wie R zu vollziehen. Mit translate2R wird diese Hürde entscheidend abgebaut. „Viele Unternehmen haben die Vorteile von R erkannt. Alte Skripte mit tausenden Zeilen SPSS Code stellen bei der Migration nach R eine Hürde und ein schwer kalkulierbares Kostenrisiko dar. translate2R hilft hier entscheidend das Risiko zu begrenzen “ erklärt Oliver Bracht, CTO bei eoda, den Nutzen von translate2R für die Anwender.

translate2R: Anwenderfreundlich und intuitiv nutzbar

translate2R, entwickelt in einer durch das LOEWE-Programm des Landes Hessen geförderten Kooperation von eoda und der Universität Kassel, soll zukünftig sowohl als Cloudservice, als auch als On-Premise Variante verfügbar sein. Die Übersetzung vollzieht sich für den User in zwei Schritten. Zunächst wird SPSS-Syntax in das anwenderfreundliche Browserfrontend von translate2R importiert, wo auf Knopfdruck die entsprechenden R-Funktionen generiert werden. Anschließend wird der entstandene Code in R ausgeführt. Alle dafür notwendigen Funktionen sind in dem Paket translateSPSS2R gebündelt und somit auf nahezu jeder R-Installation lauffähig. Neben Migrationsprojekten nach R unterstützt translate2R auch Programmierer, die mit SPSS® vertraut sind, und einen unkomplizierten Einstieg in R suchen. Umgekehrt ermöglicht translate2R Usern die komfortable Einbindung gewohnter SPSS Funktionen in R.

Das benutzerfreundliche Browserfrontend der automatischen Migrationslösung translate2R

Das benutzerfreundliche Browserfrontend der automatischen Migrationslösung translate2R

Weiterlesen