Die Tabelle lügt nie!? Profifußball als Anwendungsfall von Data Science

3366 Spiele, 9.661 Tore, 34 Mannschaften – die Informationen aus den letzten elf Jahren Bundesliga-Fußball sind ein Steilpass für Datenanalysten, um die unzähligen Mythen des Fußballs auf den Prüfstein zu stellen. Einer der bekanntesten von ihnen: Die Tabelle lügt nie.

Die Ausgangsfrage

Angenommen der weitverbreitete Ausspruch ‚‚Die Tabelle lügt nicht‘‘ ist wahr, dann müsste man meinen, sie repräsentiert das wahre Leistungsvermögen der Mannschaften. Leistungsvermögen ließe sich übersetzen in Gewinnwahrscheinlichkeiten und damit zu der Annahme führen: Je größer der Abstand zwischen zwei Gegnern in der Tabelle, desto höher die Gewinnwahrscheinlichkeit des favorisierten Teams. Die hier untersuchte Fragestellung lautet: Erhöht sich die Gewinnwahrscheinlichkeit einer Mannschaft mit größer werdendem Positionsabstand in der Tabelle? Dies würde auch die These eines ausgewiesenen Fußballfachmanns widerlegen: Felix Magath prägte den Satz „Die Tabelle, die ja nie lügt, täuscht ja oft.“

„Die Tabelle lügt nie!? Profifußball als Anwendungsfall von Data Science“ weiterlesen

Case Study: Kundenanalyse für die VR Bank Werra-Meißner eG

Die VR-Bank Werra-Meißner eG strebt an, ihre Vertriebsprozesse im Bereich der Kundenansprache und -betreuung zu optimieren. Konkret geht es darum, das latente Interesse der Kunden für bestimmte Themenfelder im Vorfeld einer Vertriebskampagne einzuschätzen und zu bewerten.

Ziel

Durch den Einsatz von Data-Mining Algorithmen soll die Affinität eines Kunden für das Beratungsthema berechnet werden. Eine hohe Affinität verspricht eine Steigerung der Responsequote und einen effizienteren Einsatz von Ressourcen in Marketing und Vertrieb.

Visualisierung einer Plausibilitätsanalyse
Visualisierung einer Plausibilitätsanalyse

 

„Case Study: Kundenanalyse für die VR Bank Werra-Meißner eG“ weiterlesen

EXASOL und R: Performante Kombination für die Anforderungen von Big Data

Über 180 Data Professionals aus mehr als 15 Ländern haben zwei ereignisreiche Tage auf der EXASOL Xperience 2016 in Berlin erlebt. Ein abwechslungsreiches Programm aus Vorträgen, Workshops und Partner-Sessions kombiniert mit spannendem Networking – das erste internationale Kundenevent des Datenbankanbieters EXASOL war ein voller Erfolg. Die Veranstaltung bot anhand von Best Practice Ansätzen und zahlreichen Use Cases überzeugende Einblicke in die Leistungsfähigkeit der EXASOL Datenbank und das dadurch entstehende analytische Potenzial.

Networking über den Dächern von Berlin.
Networking über den Dächern von Berlin. ©Markus Köller, www.die-lounge.com

„EXASOL und R: Performante Kombination für die Anforderungen von Big Data“ weiterlesen

Performantes Machine Learning mit R und H2O

Zum richtigen Zeitpunkt am richtigen Ort in New York die optimale Anzahl an Leihfahrrädern verfügbar haben. In Millionen von Daten des New Yorker Fahrradverleihers Citi Bike lassen sich mit Machine Learning Verfahren Muster und Gesetzmäßigkeiten erkennen, die Aufschluss über das Nutzungsverhalten der Kunden geben.

Was sind die meist frequentierten Ausleihstationen? Wann werden die meisten Fahrräder ausgeliehen? Was sind die beliebtesten Routen der New Yorker?

Mit Hilfe von Verfahren des maschinellen Lernens lassen sich diese Fragen beantworten und darüber hinaus Zukunftsprognosen erstellen, um für die Kunden das optimale Angebot bereitstellen zu können.

Performancevorteile für R-User

Eine der derzeit besten Alternativen für das Machine Learning ist das Open Source Projekt H2O. Die Lösung des gleichnamigen kalifornischen Unternehmens verfügt über ein R-Interface und ermöglicht den Anwendern der freien Programmiersprache Vorteile in puncto Performance. Die in H2O verfügbaren Funktionen und Algorithmen sind sehr performant und damit eine gute Alternative für das bereits standardmäßig in den R-Paketen verfügbare Funktionsset.

„Performantes Machine Learning mit R und H2O“ weiterlesen

[R] Kenntnis Tage 2016: Mit R und Analytik die digitale Transformation meistern

„Die digitale Transformation ist da.“ Das ist nicht nur die Botschaft der diesjährigen CeBIT, sondern die auf den Punkt gebrachte Aktualität des digitalen Wandels im Unternehmensumfeld. Datenanalyse als wichtiger Baustein der digitalen Transformation ermöglicht unter anderem vorausschauende Wartung im Rahmen von Industrie 4.0 Initiativen.

Die Programmiersprache R als lingua franca der Datenanalyse steht im Zentrum der [R] Kenntnis-Tage, die vom 02. bis 03. November 2016 in Kassel stattfinden, ausgerichtet vom Datenanalysespezialisten eoda.

R Kenntnis-Tage Logo

Die [R] Kenntnis-Tage vereinen an zwei Tagen vielfältige Themen für Anwendungsfälle wie Data Mining, Predictive Analytics oder Datenvisualisierung mit anregendem Networking und aufschlussreichen Success Stories aus der Praxis.

„[R] Kenntnis Tage 2016: Mit R und Analytik die digitale Transformation meistern“ weiterlesen

Training for the big data era: eoda publishes R Academy programme for 2016

The data analysis specialist eoda presents the programme of the R Academy for 2016. The R Academy is the comprehensive training concept for the open-source programming language R. It offers users a modular course structure covering the topics R and data analysis – either in Kassel (Germany) or as on-site training. More than 1,000 satisfied participants have already used the eoda Training.

Attractive course programme with focus on professional use of R

R is considered one of the best solutions for analysing and visualizing data, data mining and business intelligence. More and more companies in the German-speaking area are making use of the potential of R for their data-assisted processes – from sales forecast to predictive maintenance to risk analysis. “The practical requirements with regard to performance, reproducibility or maintainability of the scripts have as well been taken into account for the conception of our new course programme as methodical developments in the field of R”, Katharina Heidelbach, responsible product manager at eoda, explains. „Training for the big data era: eoda publishes R Academy programme for 2016“ weiterlesen

Schulungen für das Big-Data-Zeitalter: eoda veröffentlicht R-Akademie Programm 2016

Der Datenanalysespezialist eoda stellt das Kursprogramm der R-Akademie für das Jahr 2016 vor. Die R-Akademie ist das umfassende Schulungsprogramm für die freie Programmiersprache R. Für die Anwender eröffnet sich ein modulares Kursangebot rund um die Themen R und Datenanalyse – in Kassel oder Inhouse. Über 1.000 zufriedene Teilnehmer haben das Schulungsangebot von eoda bereits für sich genutzt.

Attraktives Kursprogramm mit Fokus auf die professionelle Nutzung von R

R gilt als eine der besten Lösungen zur Analyse und Visualisierung von Daten, für Data Mining und Business Intelligence. Auch im deutschsprachigen Raum nutzen immer mehr Unternehmen das Potential von R für ihre datengestützten Prozesse – von der Absatzprognose, über die vorausschauende Instandhaltung bis zur Risikoanalyse. „Die Anforderungen in der Praxis hinsichtlich Performance, Reproduzierbarkeit oder der Wartbarkeit der Skripte haben wir bei der Konzeption unseres neuen Kursprogramms genauso aufgegriffen wie methodische Weiterentwicklungen im Umfeld von R“ erklärt Katharina Heidelbach, zuständige Produktmanagerin bei eoda.

„Schulungen für das Big-Data-Zeitalter: eoda veröffentlicht R-Akademie Programm 2016“ weiterlesen

Data Mining with R: Generate knowledge from data with the eoda R-Academy

The course “Data Mining with R”, which takes place from 9th to 10th November 2015 in Kassel, Germany, teaches the most important methods to expose correlations in data and inherent patterns.

The wide set of methods can be used for almost every application area. From customer segmentation to timely recognition of machines, users gain knowledge from data and therefore advantages in competition because of the right use of methods.

By means of practical examples, the following topics will be addressed:

  • Introduction to Data Mining
  • Evaluation model: Selection of model and data base, error matrix, risk charts, ROC, sensitivity, precision, Lift, forecast and observation
  • Explorative Analysis: Tabular analysis, visual analysis (metric, categorical), correlation analysis, Missing value correlation
  • Association Analysis: Support, confidence, Lift, interpretation
  • Regression- and Decision Trees: Algorithm, interpretation, graphical interpretation
  • Neural Networks: Theory, learning process in KNN, nnet
  • Random Forest: Theory, interpretation, extended options, Conditional inference trees

“Data Mining with R” shows the creation of Data Mining scripts and teaches how to use the graphical user interface “Rattle”. After the course, participants are able to apply what they have learnt for their own application purpose.

For more information about our training program and the application form feel free to click here.

Data Mining mit R: Aus Daten Wissen generieren mit der eoda R-Akademie

Im Kurs „Data Mining mit R“ vermittelt eoda am 25. und 26. April 2016 in Kassel die wichtigsten Verfahren, um Muster und Zusammenhänge in Daten zu erkennen.

Das breite Methodenset des Data Minings ist auf nahezu jeden Anwendungsbereich übertragbar. Von der Kundensegmentierung bis zur frühzeitigen Erkennung von Maschinenfehlern gewinnt der Anwender durch den richtigen Methodeneinsatz Wissen aus seinen Daten und somit Wettbewerbsvorteile.

Anhand praxisnaher Beispiele werden in der Schulung folgende Inhalte behandelt:

  • Einführung in das Data Mining
  • Modell-Evaluation: Prognose vs. Beobachtung, Fehlermatrix, ROC, Cut-Off-Value, AUC, Sensitivität, Präzision, Lift, Risikoanalyse, Risk-Chart, Ensemble Modelling
  • Data Mining Algorithmen:Decision- und Regressiontrees, Boosting, Random Forest, Neuronale Netze, Naive Bayes, Support Vector Machine

    Theorie, Parametertuning, Modell- und Prognoseerstellung

  • Ensemble Modelling: Techniken und Methoden, Bagging unterschiedlicher Modelle, Bagging eines Algorithmus, SuperLearner Package
  • Deep Learning mit H2O

Nach dem Kurs sind die Teilnehmer in der Lage, das Gelernte selbständig auf ihre jeweiligen Anwendungszwecke anzuwenden.

Weitere Informationen zur Schulung und das Anmeldeformular finden Interessierte hier.

Eine gelungene Veranstaltung: Die [R] Kenntnis-Tage 2015

Wissen & Vernetzen – unter diesem Motto fanden am 30. September und 1. Oktober die [R] Kenntnis-Tage 2015 im „Hotel Schweizer Hof“ in Kassel statt. 255 Folien R Know-how, 14 abwechslungsreiche Themenblöcke und anregendem Networking haben dieses Motto mit Leben gefüllt.

Die Eröffnungsrede der [R] Kenntnis-Tage 2015 von eoda Geschäftsführer Oliver Bracht.
Die Eröffnungsrede der [R] Kenntnis-Tage 2015 von eoda Geschäftsführer Oliver Bracht.
Vielfältige Module und inspirierende Erfolgsgeschichten aus der Praxis

Unter dem treffendem Titel „Inside R“ sind die Teilnehmer am ersten Veranstaltungstag in das Konzept und die Funktionsweise der freien Programmiersprache R eingetaucht. Diese Session war der Startschuss für den Themenblock zum Umgang mit R, der „Besser Programmieren“, „Performanceoptimierung mit C++“ und „Datenmanagement“ beinhaltete. Parallel dazu setzte der zwei Track des Tages den Schwerpunkt ganz auf die Methodik. Bei den Themen „Clusteranalyse“, „Data Mining & Predictive Analytics“, „Modelloptimierung“ und „Text Mining“ konnten die Teilnehmer Ihre R-Kenntnisse erweitern und die richtige Anwendung dieser mächtigen Analysemethoden erlernen.

„Eine gelungene Veranstaltung: Die [R] Kenntnis-Tage 2015“ weiterlesen