Case Study: Kundenanalyse für die VR Bank Werra-Meißner eG

Die VR-Bank Werra-Meißner eG strebt an, ihre Vertriebsprozesse im Bereich der Kundenansprache und -betreuung zu optimieren. Konkret geht es darum, das latente Interesse der Kunden für bestimmte Themenfelder im Vorfeld einer Vertriebskampagne einzuschätzen und zu bewerten.

Ziel

Durch den Einsatz von Data-Mining Algorithmen soll die Affinität eines Kunden für das Beratungsthema berechnet werden. Eine hohe Affinität verspricht eine Steigerung der Responsequote und einen effizienteren Einsatz von Ressourcen in Marketing und Vertrieb.

Visualisierung einer Plausibilitätsanalyse
Visualisierung einer Plausibilitätsanalyse

 

„Case Study: Kundenanalyse für die VR Bank Werra-Meißner eG“ weiterlesen

Dabei sein ist (nicht) alles: Deutsche Medaillengewinne bei Olympischen Sommerspielen

Die Olympischen Spiele in Rio stehen vor der Tür: Vom 5. bis zum 21. August suchen die besten Athleten der Welt in insgesamt 306 Wettkämpfen die Medaillengewinner. Mit am Start in Brasilien: 450 Sportler aus Deutschland mit dem Ziel die Medaillenausbeute der Olympischen Spiele 2012 in London mindestens zu bestätigen. Es ist eine der größten Delegationen, die der Deutsche Olympische Sportbund zu den Spielen entsenden wird und eine, die den Trend zu einer homogenen Verteilung zwischen männlichen und weiblichen Startern fortsetzen wird.

Größe und Geschlechtsverteilung der deutschen Olympia Mannschaften seit 1948
Größe und Geschlechtsverteilung der deutschen Olympia Mannschaften seit 1948

„Dabei sein ist (nicht) alles: Deutsche Medaillengewinne bei Olympischen Sommerspielen“ weiterlesen

[R] Kenntnis Tage 2016: Mit R und Analytik die digitale Transformation meistern

„Die digitale Transformation ist da.“ Das ist nicht nur die Botschaft der diesjährigen CeBIT, sondern die auf den Punkt gebrachte Aktualität des digitalen Wandels im Unternehmensumfeld. Datenanalyse als wichtiger Baustein der digitalen Transformation ermöglicht unter anderem vorausschauende Wartung im Rahmen von Industrie 4.0 Initiativen.

Die Programmiersprache R als lingua franca der Datenanalyse steht im Zentrum der [R] Kenntnis-Tage, die vom 02. bis 03. November 2016 in Kassel stattfinden, ausgerichtet vom Datenanalysespezialisten eoda.

R Kenntnis-Tage Logo

Die [R] Kenntnis-Tage vereinen an zwei Tagen vielfältige Themen für Anwendungsfälle wie Data Mining, Predictive Analytics oder Datenvisualisierung mit anregendem Networking und aufschlussreichen Success Stories aus der Praxis.

„[R] Kenntnis Tage 2016: Mit R und Analytik die digitale Transformation meistern“ weiterlesen

Eine gelungene Veranstaltung: Die [R] Kenntnis-Tage 2015

Wissen & Vernetzen – unter diesem Motto fanden am 30. September und 1. Oktober die [R] Kenntnis-Tage 2015 im „Hotel Schweizer Hof“ in Kassel statt. 255 Folien R Know-how, 14 abwechslungsreiche Themenblöcke und anregendem Networking haben dieses Motto mit Leben gefüllt.

Die Eröffnungsrede der [R] Kenntnis-Tage 2015 von eoda Geschäftsführer Oliver Bracht.
Die Eröffnungsrede der [R] Kenntnis-Tage 2015 von eoda Geschäftsführer Oliver Bracht.
Vielfältige Module und inspirierende Erfolgsgeschichten aus der Praxis

Unter dem treffendem Titel „Inside R“ sind die Teilnehmer am ersten Veranstaltungstag in das Konzept und die Funktionsweise der freien Programmiersprache R eingetaucht. Diese Session war der Startschuss für den Themenblock zum Umgang mit R, der „Besser Programmieren“, „Performanceoptimierung mit C++“ und „Datenmanagement“ beinhaltete. Parallel dazu setzte der zwei Track des Tages den Schwerpunkt ganz auf die Methodik. Bei den Themen „Clusteranalyse“, „Data Mining & Predictive Analytics“, „Modelloptimierung“ und „Text Mining“ konnten die Teilnehmer Ihre R-Kenntnisse erweitern und die richtige Anwendung dieser mächtigen Analysemethoden erlernen.

„Eine gelungene Veranstaltung: Die [R] Kenntnis-Tage 2015“ weiterlesen

eoda auf der useR! Conference 2015 in Aalborg: Ein Resümee

R goes professional – so könnte das Fazit der diesjährigen Konferenz für Entwickler und Nutzer der Programmiersprache R lauten. Rund 660 Teilnehmer aus über 40 verschiedenen Ländern erhielten im dänischen Aalborg einen Einblick in neue Pakete, aktuelle Entwicklungen im Umfeld der Community und interessante Anwendungsfälle von R.

Aalborg: Der Veranstaltungsort der useR! 2015
Aalborg: Der Veranstaltungsort der useR! 2015

R erreicht die nächste Entwicklungsstufe

Die Professionalisierung von R war das übergreifende Thema der Konferenz. Angetrieben von der immer stärkeren Verbreitung von R im Unternehmenskontext erreicht die Lingua franca der Datenanalyse die nächste Entwicklungsstufe. Von der Performanceoptimierung über die Steigerung der Reproduzierbarkeit bis hin zur Validierung – die useR! 2015 hat die positiven Entwicklungen von R im Hinblick auf die Leistungsfähigkeit und Usability im kommerziellen Bereich gezeigt.

„eoda auf der useR! Conference 2015 in Aalborg: Ein Resümee“ weiterlesen

eoda auf der useR! Conference 2015 in Aalborg: Die Highlights vom ersten Präsentationstag – Teil 1

Die useR! Conference 2015 ist offiziell eröffnet: Nach dem „Tutorial-Tuesday“ folgte am Mittwoch der erste Präsentationstag.

Impression von der Opening Session am Dienstag
Impression von der Welcome reception der useR! 2015 am Dienstag

Unsere R-Experten vor Ort haben die wichtigsten Informationen und Neuerungen der Sessions vom Vormittag zusammengefasst:

Networks

Wie kann man möglichst viele Konferenzteilnehmer dazu bewegen, den eigenen Vortrag zu besuchen? Eine Möglichkeit besteht darin, potentielle Interessenten mit personalisierter Onlinewerbung auf sich aufmerksam zu machen. Anhand dieses nicht ganz ernstgemeinten Anwendungsbeispiels hat Daroczi im ersten Vortrag der Networks-Session aufgezeigt, wie mit Hilfe des Pakets fbRads aus R heraus Werbekampagnen auf Facebook aufgesetzt und gesteuert werden können. Der große Vorteil dabei: Im Zusammenspiel mit der Facebook API deckt das Paket den kompletten Prozess einer Werbekampagne ab – von der Definition der Zielgruppe bis zur Auswertung der Werbewirksamkeit.

Peter Meißner hat sich in seinem Vortrag dem Thema Webscraping gewidmet und gab einen Überblick darüber, was zu tun ist, wenn der Download-Button fehlt und die gewünschten Informationen stattdessen direkt aus einer Webseite extrahiert werden müssen. Je nachdem welche Web-Technologien auf der relevanten Webseite eingesetzt werden, kommen für das Webscraping mit R verschiedene Funktionen und Pakete infrage. Im einfachsten Fall reichen bereits base-Funktionen wie download.file() und einfache String-Manipulationen aus. Am einfachsten dürften die meisten Webscraping-Projekte jedoch mit dem Paket rvest zu lösen sein. Sollte dies nicht möglich sein, weil sich die gewünschten Informationen zum Beispiel in JS-Code verbergen, kann mit RSelenium ein virtueller Browser emuliert werden.

Reproducibilty

Reproduzierbarkeit kann in der R-Community aus verschiedenen Blickwinkeln betrachtetet werden, dass wurde auch in der Mischung der heutigen Präsentationen zu diesem Thema deutlich.

Das Programm der Session Reproducibilty
Das Programm der Session Reproducibilty

Während Karthik Ram und Joshua R. Polanin mit ihren Talks den Fokus auf die wissenschaftlichen Aspekte von Reproducibility legten, haben sich Michael Lawrence und David Smith mit dem Problem der Versionierung von R Paketen beschäftigt.

„eoda auf der useR! Conference 2015 in Aalborg: Die Highlights vom ersten Präsentationstag – Teil 1“ weiterlesen

eoda auf der useR! Conference 2015 in Aalborg: Die Eindrücke vom „Tutorial Tuesday“

Mit dem „Tutorial-Tuesday“ hat gestern in Aalborg die useR! Conference 2015 begonnen. Unser Team vor Ort hat viele der Tutorials besucht und die wichtigsten Informationen für die R-User zusammengefasst:

Rocker: Using R on Docker (Dirk Eddelbuettel)

Seit einiger Zeit schon gehört Docker zu den am heißesten diskutierten Ansätzen in der IT-Welt. Docker ist eine Abstraktionsschicht, vergleichbar mit einer Virtualisierungsumgebung. Innerhalb von Docker finden sich Container, die einer virtuellen Maschine (VM) entsprechen. Im Unterschied zu VMs sind Docker Container jedoch leichtgewichtig: Sie benötigen kein eigenes Betriebssystem, sie verbrauchen deutlicher weniger Disk space, sie lassen sich schnell und einfach erstellen, verteilen und initialisieren. Docker läuft auf allen gängigen Betriebssystemen und wird von nahezu allen wichtigen Cloudanbietern (Microsoft Azure, Amazon, Digital Ocean etc.) unterstützt.

Dirk Eddelbuettel, Mitentwickler des populären C++ Interfaces Rcpp, stellte in seinem Tutorium Rocker vor. Rocker steht für R on Docker. Es handelt sich dabei nicht um ein R Paket, sondern um ein Set von R-Instanzen, die sich in Docker Containern befinden. Eddelbuettels Kern-Anwendungsszenario ist das Testing. Mit Hilfe von Docker lässt sich Code automatisiert auf unterschiedlichen R Versionen testen. Rocker lässt sich leicht erweitern –  sei es für spezielle Einsatzszenarien oder generelle Anwendungsfälle, die dann über den Docker Hub veröffentlicht werden können.

Ein anderes interessantes Anwendungsfeld von Docker ist die Reproduzierbarkeit von Analysen. Mit Docker lassen sich Skripte für bestimmte R-Versionen inklusive aller verwendeter Pakete in den verwendeten Versionen in einen Container packen und archivieren. Docker bietet damit eine weitere Alternative zu den gängigen Ansätzen Packrat von RStudio und checkpoint von Revolution Analytics.

Statistical analysis of Network data (Gábor Csárdi)

Netzwerke sind heutzutage allgegenwärtig. Beispiele hierfür sind die Kontakte in sozialen Netzwerken wie Facebook oder Twitter, Verlinkungen von einer Internetseite zur anderen oder der Verkehrsflussfluss zwischen Flughäfen. Gábor Csárdi, Maintainer des weitverbreiteten igraph-Pakets, hat mit seinem Tutorial einen spannenden Überblick darüber gegeben, wie sich die vielzähligen Verbindungen und Strukturen innerhalb eines Netzwerks mit den Methoden der Netzwerkanalyse untersuchen lassen.
Zu Beginn des Tutorials wurden verschiedene Datenstrukturen zur Repräsentation von Netzwerkdaten vorgestellt. Im zweiten Teil lag der Fokus auf den Methoden, mit denen sich die Struktur des Netzwerks beschreiben lassen. Welche Knoten sind besonders gut vernetzt? Über wie viele Ecken sind die Knoten in einem Netzwerk miteinander verknüpft? Die Netzwerkanalyse mit R gibt Antworten auf diese Fragestellungen.
Anschließend wurden verschiedene Ansätze präsentiert, mit denen sich Gruppen innerhalb eines Clusters identifizieren lassen. Zum Abschluss gab Csárdi einen kurzen Überblick über die Visualisierung von Netzwerken.

Alles in allem gab das Tutorial einen guten Einblick in die zentralen Begriffe der Netzwerkanalyse und hat Lust auf mehr gemacht.

„eoda auf der useR! Conference 2015 in Aalborg: Die Eindrücke vom „Tutorial Tuesday““ weiterlesen

[R] Kenntnis-Tage 2015: The first holistic R Event in the German-speaking community

The event aims at connecting R users from all industrial and academic sectors and facilitating the interconnectedness of the German-speaking R community as well as the exchange of practical and theoretical knowledge about R.

From September 29 to October 02 the [R] Kenntnis-Tage 2015 with topics ranging from big data over programming and data mining up to predictive analytics will take place in Kassel, Germany. We are looking forward to all interested registering here.

Also, if you would like to know more about eoda, one of the pioneering integrators of R in Germany, please feel free to browse around here.

We hope to see you in Kassel in autumn!

The official program of the [R] Kenntnis-Tage 2015 in Kassel, Germany.
The official program of the [R] Kenntnis-Tage 2015 in Kassel, Germany.
Topics of the event: programming with R, cluster analysis, data mining, predictive analytics, model optimization, data management, performance optimization with C++, text mining, profiling, debugging, visualization, ggplot, base R, interactive graphics, big data, introduction to R

The [R] Kenntnis-Tage will be continued in the future, information will follow soon at our blog or homepage.

Pressemitteilung: [R] Kenntnis-Tage 2015: Das umfassende Event für die Statistiksprache R

Kassel, 23.04.2015 – eoda, einer der Pioniere in der professionellen Anwendung der Statistiksprache R, veranstaltet Ende September in Kassel mit den [R] Kenntnis-Tagen ein zweitägiges Event für die immer größer werdende deutschsprachige R-Community. Die [R] Kenntnis-Tage vereinen konzentriert vielfältige Themen für Anwendungsfälle wie Data Mining, Predictive Analytics oder Datenvisualisierung mit anregendem Networking und aufschlussreichen Success Stories aus der Praxis.

„Mit den [R] Kenntnis-Tagen wollen wir deutschsprachigen R-Nutzern eine Plattform bieten, auf der wir die vielfältigen Möglichkeiten von R für Data Science zeigen und die Teilnehmer dazu inspirieren, Ihre eigene Erfolgsgeschichte im Umfeld von R zu schreiben“, erklärt Oliver Bracht, Chief Data Scientist bei eoda, die Hintergründe der Veranstaltung.

Die freie Wahl aus einem ganzheitlichen Themenangebot

Die erfahrenen Trainer von eoda präsentieren in zwei parallel laufenden Schulungstracks in sich abgeschlossene Module zu vielfältigen Themen im Umfeld der Datenanalyse. Die Teilnehmer haben die Freiheit, aus diesen Modulen gezielt die Themen auszuwählen, die sie und ihr Unternehmen weiterbringen.

Die Module behandeln den effizienten Einsatz von R in Produktivumgebungen, wichtige statistische Methoden und das beliebte Thema Datenvisualisierung. „Der Leitgedanke der [R] Kenntnis-Tage ist es, jedem Teilnehmer in kürzester Zeit das Wissen und wertvolle Anregungen zu vermitteln, um ihm den maximalen Nutzen in der Anwendung von R zu ermöglichen“, erläutert Bracht das Ziel der ganzheitlichen Veranstaltung.

Aufbau der eoda [R] Kenntnis-Tage 2015
Aufbau der eoda [R] Kenntnis-Tage 2015
„Pressemitteilung: [R] Kenntnis-Tage 2015: Das umfassende Event für die Statistiksprache R“ weiterlesen

Spatial visualization with R – Tutorial

The visualization of spatial data is one of the most popular applications when using R. This tutorial is an introduction to the visualization of spatial data and creation of geographic maps with R.

Spatial Visualisation with R
Spatial Visualisation with R

The focus will be on the following subjects:

  • Import and use of shapefiles in R (the shapefile is a file format designed for spatial data).
  • Data management and restructuring of data.
  • The creation of maps.
  • Visualization of data on maps.
  • Enrichment of created maps using the spatial information of static maps from OpenStreetMap.de.

 

This tutorial shows the creation of a map of the different districts of Kassel including the number of households within each district. This type of map is also known as Choropleth map. Going even further, this map will also contain the stations of the Kassel bicycle sharing system “Konrad”.

 

„Spatial visualization with R – Tutorial“ weiterlesen