Spatial visualization with R – Tutorial

The visualization of spatial data is one of the most popular applications when using R. This tutorial is an introduction to the visualization of spatial data and creation of geographic maps with R.

Spatial Visualisation with R

Spatial Visualisation with R

The focus will be on the following subjects:

  • Import and use of shapefiles in R (the shapefile is a file format designed for spatial data).
  • Data management and restructuring of data.
  • The creation of maps.
  • Visualization of data on maps.
  • Enrichment of created maps using the spatial information of static maps from OpenStreetMap.de.

 

This tutorial shows the creation of a map of the different districts of Kassel including the number of households within each district. This type of map is also known as Choropleth map. Going even further, this map will also contain the stations of the Kassel bicycle sharing system “Konrad”.

 

Weiterlesen

Tutorial: Kartenvisualisierung mit R

Die Visualisierung von Regional- und Geodaten ist eines der gefragtesten Themen im Umfeld von R. Das folgende Tutorial gibt einen Einblick in die Kartenvisualisierung mit der freien Programmiersprache.

Beispiel einer Kartenvisualisierung mit R

Beispiel einer Kartenvisualisierung mit R

Behandelt werden folgende Themen:

  • Einlesen und Umgang mit Shapefiles in R (Shapefile ist ein Speicherformat speziell für Geodaten).
  • Datenmanagement bzw. Umstrukturieren von Datensätzen
  • Visualisierung von Daten auf einer Karte
  • Anreichern einer Karte mit weiteren Inhalten von openstreetmap.de.

Das Tutorial zeigt die Erstellung einer Karte der Kasseler Stadtbezirke einschließlich der grafischen Darstellung der dort ansässigen Haushalte. Solch ein Kartentyp wird auch als Choropleth Karte bezeichnet. In einem weiteren Schritt werden zusätzlich Stationen des Kasseler Fahrradverleihsystems Konrad eingezeichnet.

Weiterlesen

eoda erweitert das beliebte deutschsprachige R-Schulungsprogramm für den professionellen Einsatz

Der Kasseler Datenanalysespezialist eoda stellt das neue Kursprogramm der R-Akademie für das Jahr 2015 vor. Die eoda R-Akademie ist ein umfassendes deutschsprachiges  Schulungsprogramm für die freie Statistiksprache R. Seit 2011 befähigt eoda mit seinem etablierten Trainingsprogramm Anwender dazu, dass nahezu unbegrenzte analytische Potential von R für sich zu nutzen.

Neue Kurse für den professionellen Einsatz von R im Unternehmenskontext

Mit dem Anspruch Interessenten ein möglichst ganzheitliches Kursangebot rund um die Themen R und Datenanalyse anzubieten hat eoda die R-Akademie für das kommende Jahr nochmals weiterentwickelt. Das bedeutet, dass neben den bewährten Modulen neue Kurs entstanden sind, die das bereits bestehende Angebot der R-Akademie abrunden. „R entwickelt sich zunehmend zur plattformübergreifenden Lingua franca für Datenanalysten. Dies hat zur Folge, dass die Nutzerzahlen stetig steigen und damit einhergehend R immer häufiger auch in Deutschland im Unternehmensumfeld zum Einsatz kommt. Die dadurch entstehenden besonderen Anforderungen hinsichtlich Reproduzierbarkeit, Teamarbeit oder Kompatibilität haben wir bei der Konzeption unseres neuen Kursprogramms aufgegriffen.“ erklärt Heiko Miertzsch, Geschäftsführer von eoda, die Vorteile des neuen Angebotes für die Teilnehmer.

Der Aufbau der eoda R-Akademie 2015

Der Aufbau der eoda R-Akademie 2015

Konkret wird die R-Akademie 2015 um fünf Kurse erweitert:

  • Multivariate Statistik mit R II
  • Paketerstellung in R
  • R im produktiven Unternehmensumfeld
  • Datenmanagement mit R
  • Werbewirkungsanalyse mit R

Weiterlesen

eoda vertreibt RStudio-Produkte in Europa und unterstützt Anwender mit Beratung und Training.

  • RStudio ist die beliebteste Entwicklungsumgebung für R-Anfänger und Profis
  • Interaktive webbasierte R-Anwendungen mit Shiny entwickeln

Der Datenanalysespezialist eoda und RStudio, Anbieter der populären gleichnamigen Entwicklungsumgebung für die quelloffene Datenanalyse-Software „R“, geben ihre Partnerschaft bekannt.

Partnerschaft zwischen RStudio und eoda

Partnerschaft zwischen RStudio und eoda

Der Erfolg von R beruht auf der Synergie einer engagierten und weltweit vernetzten wissenschaftlichen Community und dem Engagement nahezu aller kommerziellen Anbieter von Datenbank- oder BI-Produkten. RStudio gelingt es, das Momentum der Community mit den Anforderungen professioneller Anwender zu verbinden. Exemplarisch dafür steht Hadley Wickham, einer der führenden Köpfe der R-Community, der von RStudio als Chief Scientist gewonnen werden konnte.

Neben dem Kernprodukt, einer Entwicklungsumgebung für R, veröffentlicht RStudio zahlreiche freie Software-Pakete zu den Themen Datenmanagement (reshape2, plyr, dplyr), Paketverwaltung (packrat), Code-Dokumentation (roxigen), Visualisierung (ggplot2, ggvis) und Reproducible Research (knitr und R Markdown). RStudio gehört damit zu den wichtigsten Wegbereitern der professionellen Verwendung von R im Unternehmensumfeld.

Weiterlesen

translate2R: Migrate SPSS scripts to R at the push of a button

After their presentation at the international “user!” conference, data analysis specialist eoda starts the public alpha testing of translate2R. With the start of alpha testing the innovative migration solution by the company hailing from Kassel discards the working title “translateR” and takes on the final product brand name “translate2R”. translate2R is a service for the automated translation of SPSS® syntax to R code, therefore supporting data analysts with a quick and low-risk migration to R.

The manual translation of many, frequently rather complex SPSS scripts often presents itself as a tedious and error-prone task, and represents a rather large obstacle for many analysts and companies to migrate to a modern, open source data management and analysis tool like R. With translate2R this hurdle will be diminished substantially. “Many companies have recognized the advantages of R. Still, old scripts with thousands of rows of code in other statistics languages pose a large barrier and an almost incalculable risk when migrating to R. translate2R will help limiting this risk distinctively”, Oliver Bracht, CTO of eoda, explains the value of translate2R for users.

translate2R: user friendly and intuitive

translate2R, developed by a cooperation between eoda and the University of Kassel and sponsored by the LOEWE program of the German state of Hesse, will be provided as both, a cloud service and on premise. The translation will be processed in two steps for the user: first, the SPSS syntax will be imported into the user friendly browser frontend of translate2R, then the corresponding R functions will be generated by the push of a button. Finally, the generated code will be executed in R. The accompanying R package translateSPSS2R contains all required functions for the code to run appropriately and is compatible will almost every possible installation of R. Besides migration projects to R, translate2R also support programmers who are firm with SPSS and who are looking for a comforting introduction into R. Vice versa, translate2R also enables users to comfortably implement common SPSS functions in R.

The user friendly browser frontend of translate2R.

The user friendly browser frontend of translate2R.

Weiterlesen

translate2R: SPSS Skripte auf Knopfdruck nach R migrieren

Nach der Präsentation auf der internationalen „useR!“ Conference geht der Datenanalysespezialist eoda mit translate2R in den öffentlichen Alpha Test. Zum Start der Alpha Testphase legt die innovative Migrationslösung des Kasseler Unternehmens den Arbeitstitel „translateR“ ab und trägt ab sofort die finale Produktbezeichnung „translate2R“. translate2R ist ein Dienst zur automatischen Übersetzung von SPSS® Syntax in R Code. Damit unterstützt translate2R Datenanalysten bei einer schnellen und risikoarmen Migration nach R.

Die manuelle Übersetzung vieler oft komplexer SPSS Skripte als langwierige und fehleranfällige Aufgabe stellt für zahlreiche Analysten und Unternehmen eine große Hürde dar, den Wechsel auf ein modernes freies Datenmanagement- und Analysetool wie R zu vollziehen. Mit translate2R wird diese Hürde entscheidend abgebaut. „Viele Unternehmen haben die Vorteile von R erkannt. Alte Skripte mit tausenden Zeilen SPSS Code stellen bei der Migration nach R eine Hürde und ein schwer kalkulierbares Kostenrisiko dar. translate2R hilft hier entscheidend das Risiko zu begrenzen “ erklärt Oliver Bracht, CTO bei eoda, den Nutzen von translate2R für die Anwender.

translate2R: Anwenderfreundlich und intuitiv nutzbar

translate2R, entwickelt in einer durch das LOEWE-Programm des Landes Hessen geförderten Kooperation von eoda und der Universität Kassel, soll zukünftig sowohl als Cloudservice, als auch als On-Premise Variante verfügbar sein. Die Übersetzung vollzieht sich für den User in zwei Schritten. Zunächst wird SPSS-Syntax in das anwenderfreundliche Browserfrontend von translate2R importiert, wo auf Knopfdruck die entsprechenden R-Funktionen generiert werden. Anschließend wird der entstandene Code in R ausgeführt. Alle dafür notwendigen Funktionen sind in dem Paket translateSPSS2R gebündelt und somit auf nahezu jeder R-Installation lauffähig. Neben Migrationsprojekten nach R unterstützt translate2R auch Programmierer, die mit SPSS® vertraut sind, und einen unkomplizierten Einstieg in R suchen. Umgekehrt ermöglicht translate2R Usern die komfortable Einbindung gewohnter SPSS Funktionen in R.

Das benutzerfreundliche Browserfrontend der automatischen Migrationslösung translate2R

Das benutzerfreundliche Browserfrontend der automatischen Migrationslösung translate2R

Weiterlesen

Statistische Prozesskontrolle als Grundlage optimalen Qualitätsmanagements

  • Potenziale erschließen durch die Integration der leistungsfähigen Programmiersprache
  • Training zur angewandten Statistik im Qualitätsmanagement vom 2. bis 4. Dezember

In Zeiten immer dynamischer werdender Produktionsabläufe und Prozesse gewinnt das Qualitätsmanagement stetig an Bedeutung.

Systematisch durchgeführte statistische Kontrollen in Liefer- und Fertigungskette sowie Prozessmonitoring im Sinne von Six Sigma können dabei helfen, Ausfallraten zu minimieren, die Produktqualität zu steigern und damit die Kundenzufriedenheit zu erhöhen.

Die Verringerung von Warenrücknahmen, sicheres Prozessmanagement und ein verbessertes Unternehmensimage sind positive Auswirkungen eines zuverlässigen Qualitätsmanagements auf die Unternehmensperformance.

Unzureichendes statistisches Know-how im Qualitätsmanagement als Risikofaktor

Im Gegensatz dazu stellen beispielsweise unzureichend geprüfte Wareneingänge und Analysen von Prozesskennzahlen ein unkalkulierbares Risiko dar. Innerhalb der Supply-Chain und über den gesamten Produktionsprozess hinweg können nicht angemessene Kontrollen immense Kosten verursachen.

Ein durchdachter Prüfplan zur Qualitätsbewertung und –kontrolle trägt hier erheblich zur Risikominimierung durch eine frühzeitige Fehlererkennung bei. Zusätzlich entsteht durch die detaillierte Dokumentation der Prüfungen die Grundlage für belastbare Argumente gegenüber den Vertragspartnern.

Weiterlesen

tableR vereinfacht die Prozesse von Marktforschern und Analysten

tableR ist eine neue Software von eoda, die den gesamten Prozess von der Erstellung des Fragebogens bis zur fertigen Ergebnispräsentation ohne Medienbrüche unterstützt. Ohne Programmierkenntnisse können Anwender Fragebögen entwerfen, Rohdaten auswerten und Tabellen sowie Grafiken erstellen.

Heterogene Toollandschaft führt oft zu Fehlern und hohen Prozesskosten

Die Auswertung von Daten ist oftmals gekennzeichnet durch Medienbrüche und manuelle Arbeitsschritte. Meist wird verschiedenartige Software für einzelne Prozessvorgänge genutzt. Damit sind notwendigerweise manuelle Transformationsschritte verbunden, die zu hoher Fehleranfälligkeit, zeitlichen Verzögerungen und unnötigen Kosten führen. Ineffizienzen, Qualitätsprobleme, zu lange Projektlaufzeiten und unzufriedene Kunden sind regelmäßig die Konsequenz. Gefördert durch das LOEWE-Programm des Landes Hessen, bietet eoda Marktforschern und allen, die regelmäßig Daten auswerten, eine Software, die die Prozesseffizienz dauerhaft steigert.

tableR: Fragebögen, Auswertungen, Tabellen und Grafiken in einem Tool

Mit tableR können Benutzer Fragebögen erstellen und diese sowohl als Office-Dokument exportieren, als auch mit Hilfe eines strukturierten XMLs zu einem Onlinefragebogen weiterverarbeiten. Der Fragebogen dient dabei außerdem als strukturierte Repräsentation der zu importierenden Rohdaten. Auf dieser Basis lässt sich mit einem Klick ein fertiger Report anfertigen, der vielfältig individualisiert werden kann. Die erstellten Tabellen und Grafiken können nach Office (Word, Excel, PowerPoint) und HTML exportiert werden. tableR bietet einen reproduzierbaren Ablauf. Dabei entsteht das zur Auswertung notwendige Skript automatisch im Hintergrund. Neben der Anwendung in der klassischen Marktforschung hat tableR ein vielfältiges Einsatzpotential, so können beispielweise beliebige strukturierte Datensätze eingelesen und analysiert werden. Weitere Analysemöglichkeiten sind durch die Integration der freien Statistiksprache R nahezu grenzenlos.

Diese Diashow benötigt JavaScript.

Beta-Test ermöglicht exklusive Einblicke in die Entwicklung von tableR

eoda startet ab dem 15. September einen Beta-Test für tableR. Interessierte können sich unter www.eoda.de/de/tabler.html registrieren. Teilnehmer des Beta-Tests haben die Möglichkeit, ihre Wünsche und Anregungen in die finalen Entwicklungsschritte von tableR einfließen zu lassen und so die Weiterentwicklung zu beeinflussen.

Survival-Analyse mit R als Fundament für Entscheidungen in Produktion und Vertrieb

Alles hat einen Anfang und ein Ende. Aber wann fängt es an? Und wann hört es auf? Mit diesen Fragen stößt man auf den Kern der Survival-Analyse.  Survival-Modelle schätzen, wieviel Zeit vergeht, bis ein bestimmtes Ereignis – ob positiv oder negativ – eintritt. Ursprünglich bestand das Ziel darin, den voraussichtlichen Todeszeitpunkt von Personen zu schätzen. Heute hat sich das Anwendungsfeld längst auf die verschiedensten Disziplinen und Gebiete ausgedehnt.

Survival-Analyse: Eine Grundidee – viele Anwendungsbereiche

Grundlage für den Einsatz von Survival-Analysen ist das Vorliegen von Mortalität, welche das sukzessive Ausscheiden von Messobjekten aus der statistischen Erfassung beschreibt. Die Grundidee von Ereigniszeitanalysen, wie Survival-Analysen auch genannt werden, wurde bereits in vielen Anwendungsbereichen adaptiert:

  • Industriekonzerne ermitteln auf Basis der Erkenntnisse aus Ereigniszeitanalysen, wann ein Maschinenausfall droht um ihre Instandhaltungsprozesse daraufhin anzupassen und kostenintensive Maschinenausfälle zu vermeiden. In die Bestimmung der Ausfallrate fließen neben Zustandsdaten von Maschinenkomponenten auch Informationen aus Drittsystemen (CRM-Systeme etc.) mit ein.

 

  • Customer-Relationship und Churn-Management Systeme können mit demografischen Informationen der Kunden und relevanten Marktinformationen für Vorhersagemöglichkeiten erweitert werden. So lässt sich ermitteln wann ein Neukunde bereit ist einen Vertrag abzuschließen, oder ein Bestandskunde droht abzuwandern. Proaktive Gegenmaßnahmen wie Rabatte, Prämien oder Boni können eingeleitet werden.

 

  • In der Sozialforschung werden Aussagen zu beginnenden oder endeten Lebensphasen anhand von Daten aus sozialen Netzwerken getroffen. Alter, Beruf, Herkunft oder Schulabschluss der Partner sind Indikatoren, anhand derer beispielsweise die Überlebensdauer einer Beziehung bis zu einer möglichen Trennung prognostiziert wird.

Survival-Analysen geben entscheidende Einblicke in Prozessabläufe und erhöhen als belastbare Entscheidungsgrundlage die Handlungsfähigkeit. Im ökonomischen Umfeld werden Kosten gesenkt und die Effizienz von Produktion und Vertrieb gesteigert.

Survivor-Function und Hazard-Rate als Grundfunktionen

Methodisch grenzt die Survival-Analyse zwei wichtige Grundfunktionen voneinander ab: Survivor-Funktion und Hazard-Rate. Die Survivor-Funktion beschreibt den Anteil der Fälle, bei denen das untersuchte Ereignis noch nicht eingetreten ist. Die Hazard-Rate hingegen steht für das unmittelbare Risiko des Eintretens des Ereignisses für einen bestimmten Fall.

Survivor-Funktion und Hazard-Rate als Grundfunktionen der Survival-Analyse mit R

Survivor-Funktion und Hazard-Rate als Grundfunktionen der Survival-Analyse mit R

Weiterlesen

CRM-Daten Bereinigung: Unterstützung der Migration zu Microsoft Dynamics CRM®

CRM-Migration als Erfolgsfaktor im Vertrieb

Wie wichtig aktuelle, leicht nutzbare und hochwertige Kundendaten in einer zentralen Datenbasis im Vertrieb sind, hat ein innovativer Industriekonzern früh erkannt. Bereits in den 1980er Jahren entwickelte er ein eigenes CRM-System zur Unterstützung der Vertriebsprozesse.

Um in Zeiten komplexer werdender Anforderungen und neuer technischer Möglichkeiten die Arbeit der in die Vertriebsprozesse involvierten Fachabteilungen weiter zu erleichtern und zu verbessern, entschied sich der Konzern zu einer Migration zu Microsoft CRM©.

In der Analyse vor der Migration zeigte sich schnell, dass die schlechte Datenqualität, die vor allem aus den limitierten Möglichkeiten des Legacy-Systems herrührte eine 1:1 Migration der Daten unmöglich machte. Ein wesentlicher Faktor einer erfolgreichen Migration, stellt die Nutzerakzeptanz dar. Das neue System zeigte schonungslos die Schwächen des alten Systems wie limitierte Feldgrößen, verschiedene Zeichensätze, erzwungene Großschreibung, oder unklare Bedeutung der Felder auf. Die Datenqualität stand im Widerspruch zu den Möglichkeiten, die das neue System bot. Neben der Nutzerakzeptanz, spielt gerade im Vertrieb die Datenqualität für Prozesse wie Kundenansprache oder Logistik eine nicht zu unterschätzende Rolle.

Die Verbesserung der Datenqualität durch Bereinigung, Strukturierung und Anreicherung der Kundendaten kristallisierte sich als ein wesentlicher Aspekt der System-Migration heraus.

Die Lösung: CRM Migration auf der Basis bereinigter Daten

Eine manuellen Datenbereinigung war in Anbetracht des umfangreichen Datenbestand mit tausenden Kundendaten aus über 40 Ländern nicht praktikabel. eoda wurde angefragt eine schnelle und zielführende Verbesserung der Datenqualität mittels einer automatisierten Bereinigung und Strukturierung der Daten durchzuführen.

Als Spezialist für die Verbesserung der Datenqualität auch in großen Datenbestände passte eoda einige der Applikationen der hauseigenen Serviceplattform „Results as a Service“ auf die speziellen Anforderungen beim Kunden an und führte das Data Cleansing mit intelligenten Algorithmen durch.

Datenanalyse und Mustererkennung

Das Data Cleansing umfasst neben der Analyse der Daten auch eine Mustererkennung. „Die Mustererkennung macht es möglich selbst in unstrukturierten Daten, mit unterschiedlichen Fehlerbildern anhand von bestimmten Merkmalen automatisiert die entsprechenden Informationen zu identifizieren“ erklärt Oliver Bracht, CEO und zuständiger Projektleiter bei eoda, das Vorgehen. Die intelligente Mustererkennung erkennt typische Muster wie Städtenamen, Telefonnummern und andere länderspezifische Merkmale der Kontakte.

Data Cleansing zur Unterstützung einer CRM-Migration

Data Cleansing zur Unterstützung einer CRM-Migration

Weiterlesen