Schlagwort-Archiv: Data Mining

translate2R: Migrate SPSS scripts to R at the push of a button

After their presentation at the international “user!” conference, data analysis specialist eoda starts the public alpha testing of translate2R. With the start of alpha testing the innovative migration solution by the company hailing from Kassel discards the working title “translateR” and takes on the final product brand name “translate2R”. translate2R is a service for the automated translation of SPSS® syntax to R code, therefore supporting data analysts with a quick and low-risk migration to R.

The manual translation of many, frequently rather complex SPSS scripts often presents itself as a tedious and error-prone task, and represents a rather large obstacle for many analysts and companies to migrate to a modern, open source data management and analysis tool like R. With translate2R this hurdle will be diminished substantially. “Many companies have recognized the advantages of R. Still, old scripts with thousands of rows of code in other statistics languages pose a large barrier and an almost incalculable risk when migrating to R. translate2R will help limiting this risk distinctively”, Oliver Bracht, CTO of eoda, explains the value of translate2R for users.

translate2R: user friendly and intuitive

translate2R, developed by a cooperation between eoda and the University of Kassel and sponsored by the LOEWE program of the German state of Hesse, will be provided as both, a cloud service and on premise. The translation will be processed in two steps for the user: first, the SPSS syntax will be imported into the user friendly browser frontend of translate2R, then the corresponding R functions will be generated by the push of a button. Finally, the generated code will be executed in R. The accompanying R package translateSPSS2R contains all required functions for the code to run appropriately and is compatible will almost every possible installation of R. Besides migration projects to R, translate2R also support programmers who are firm with SPSS and who are looking for a comforting introduction into R. Vice versa, translate2R also enables users to comfortably implement common SPSS functions in R.

The user friendly browser frontend of translate2R.

The user friendly browser frontend of translate2R.

Weiterlesen

Survival-Analyse mit R als Fundament für Entscheidungen in Produktion und Vertrieb

Alles hat einen Anfang und ein Ende. Aber wann fängt es an? Und wann hört es auf? Mit diesen Fragen stößt man auf den Kern der Survival-Analyse.  Survival-Modelle schätzen, wieviel Zeit vergeht, bis ein bestimmtes Ereignis – ob positiv oder negativ – eintritt. Ursprünglich bestand das Ziel darin, den voraussichtlichen Todeszeitpunkt von Personen zu schätzen. Heute hat sich das Anwendungsfeld längst auf die verschiedensten Disziplinen und Gebiete ausgedehnt.

Survival-Analyse: Eine Grundidee – viele Anwendungsbereiche

Grundlage für den Einsatz von Survival-Analysen ist das Vorliegen von Mortalität, welche das sukzessive Ausscheiden von Messobjekten aus der statistischen Erfassung beschreibt. Die Grundidee von Ereigniszeitanalysen, wie Survival-Analysen auch genannt werden, wurde bereits in vielen Anwendungsbereichen adaptiert:

  • Industriekonzerne ermitteln auf Basis der Erkenntnisse aus Ereigniszeitanalysen, wann ein Maschinenausfall droht um ihre Instandhaltungsprozesse daraufhin anzupassen und kostenintensive Maschinenausfälle zu vermeiden. In die Bestimmung der Ausfallrate fließen neben Zustandsdaten von Maschinenkomponenten auch Informationen aus Drittsystemen (CRM-Systeme etc.) mit ein.

 

  • Customer-Relationship und Churn-Management Systeme können mit demografischen Informationen der Kunden und relevanten Marktinformationen für Vorhersagemöglichkeiten erweitert werden. So lässt sich ermitteln wann ein Neukunde bereit ist einen Vertrag abzuschließen, oder ein Bestandskunde droht abzuwandern. Proaktive Gegenmaßnahmen wie Rabatte, Prämien oder Boni können eingeleitet werden.

 

  • In der Sozialforschung werden Aussagen zu beginnenden oder endeten Lebensphasen anhand von Daten aus sozialen Netzwerken getroffen. Alter, Beruf, Herkunft oder Schulabschluss der Partner sind Indikatoren, anhand derer beispielsweise die Überlebensdauer einer Beziehung bis zu einer möglichen Trennung prognostiziert wird.

Survival-Analysen geben entscheidende Einblicke in Prozessabläufe und erhöhen als belastbare Entscheidungsgrundlage die Handlungsfähigkeit. Im ökonomischen Umfeld werden Kosten gesenkt und die Effizienz von Produktion und Vertrieb gesteigert.

Survivor-Function und Hazard-Rate als Grundfunktionen

Methodisch grenzt die Survival-Analyse zwei wichtige Grundfunktionen voneinander ab: Survivor-Funktion und Hazard-Rate. Die Survivor-Funktion beschreibt den Anteil der Fälle, bei denen das untersuchte Ereignis noch nicht eingetreten ist. Die Hazard-Rate hingegen steht für das unmittelbare Risiko des Eintretens des Ereignisses für einen bestimmten Fall.

Survivor-Funktion und Hazard-Rate als Grundfunktionen der Survival-Analyse mit R

Survivor-Funktion und Hazard-Rate als Grundfunktionen der Survival-Analyse mit R

Weiterlesen

eoda Results as a Service – Plattform für analytische Applikationen

Mit Results as a Service bietet die eoda GmbH einen Lösungsverbund aus analytischen Applikationen auf einer skalierbaren Plattform. Die Anwendungen lösen verschiedene analytische Problemstellungen aus Bereichen wie Reporting, Data Mining oder Predictive Analytics – auch für Big Data. Zum Beispiel lassen sich mit „associateR“ Assoziationsanalysen durchführen, wie sie in der Warenkorbanalyse angewendet werden. Der „optimizeR“, löst Optimierungsprobleme die typischerweise im Kampagnenmanagement vorkommen. Eine andere Anwendung, „fuzzychekC“, findet ähnliche Einträge in Listen wie in Adressdatenbanken mit dem Ziel die Datenqualität durch die Vermeidung von Duplikaten zu verbessern. Reporting und Social Media Analysen sind andere Anwendungsgebiete. Weitere Apps befinden sich in der Entwicklung. Die Plattform bringt eine Reihe von Funktionen mit, die den Betrieb und die Administration vereinfachen wie die LDAP Integration, ein Wiki, APIs oder Schnittstellen zu Datenquellen.

"Results as a Service" von eoda

“Results as a Service” von eoda

Maßgeschneiderte Anwendungen und geringer Administrationsaufwand

Results as a Service ist vor allem ein Angebot für Fachabteilungen, die schnell eine analytische Anwendung zum Laufen bekommen möchten. Die Plattform kann auf einem Cloud Dienst oder auf einer eigenen Infrastruktur betrieben werden. Das modulare Konzept erlaubt es, die Anwendungen schnell bedarfsgerecht anzupassen und zu verbinden, so dass ganzheitliche Lösungen entstehen.

Weiterlesen

Be data driven: Der Unterschied zwischen Kreisklasse und Weltklasse?

Wenn am 12. Juni in Sao Paulo das erste Spiel der Fußballweltmeisterschaft 2014 angepfiffen wird, schaut die Welt gebannt für einen Monat nach Brasilien. Fasziniert von einem Sport der trotz seiner langen Tradition seine Einfachheit bewahrt hat. Diese Schlichtheit ermöglicht es, dass Menschen auf der ganzen Welt, unabhängig von Alter oder Talent, dem runden Leder nachjagen können. Doch mit steigender Professionalität beschränkt sich die Einfachheit zunehmend auf die Grundzüge des Spiels. Abseits des Platzes werden die Unterschiede zwischen Freizeitkickern und Vollprofis immer größer.

Datenanalyse als Erfolgsfaktor im Profifußball

Wo im Amateurbereich abseits von Punkten und Toren kaum belegbare Leistungskennzahlen existieren setzt der Profisport zunehmend auf die Macht der Zahlen. Laufwege, Zweikämpfe, Torschüsse – der Fußball wird zu einem Big Data Phänomen. Beim Streben nach dem maximalen Erfolg setzen die Trainer auf die Erkenntnisse aus den Daten. Die tägliche Trainingsarbeit basiert auf detaillierten Leistungsdiagnostiken und der genauen Kenntnis über Stärken und Schwächen der Spieler.  Der Deutsche Fußball Bund setzt beispielsweise für die Weltmeisterschaft in Brasilien auf Spielanalysen in Echtzeit und die präzise Erfassung von Laufwegen und Pässen für jeden Spieler.

Heatmap zu den Laufwegen eines Profifußballers (Quelle: www.abseits.at)

Heatmap zu den Laufwegen eines Profifußballers (Quelle: abseits.at)

Dank der analytischen Fähigkeiten des Physikers Stephen Hawking kennen sogar die wenig erfolgsverwöhnten Engländer ihre Erfolgsformel für die Fußballweltmeisterschaft 2014.

Weiterlesen

Whitepaper zu Predictive Maintenance mit R

Potenziale und Möglichkeiten der freien Statistiksprache R für neue Geschäftsmodelle im Industrie 4.0 Zeitalter 

Effiziente Produktionsprozesse mit gleichbleibend hoher Qualität sind die Basis produzierender Unternehmen, um im internationalen Wettbewerb mit immer kürzeren Produktlebenszyklen und schnelleren Technologiesprüngen zu bestehen. Ausfälle und Qualitätseinbußen aufgrund defekter Anlagen schwächen die Marktposition.

Anlagenbauern bietet Industrie 4.0 hier die Grundlage für neue Geschäftsmodelle. Beispielsweise gewinnt Instandhaltung und Wartung stetig an Bedeutung und die Entwicklung von der reaktiven Reparatur zur vorausschauenden Wartung führt zu neuen Services und Produkten.

Predictive Maintenance als Instandhaltungsstrategie der Zukunft 

„Industrie 4.0 ist die Informatisierung der Industrie und Predictive Maintenance ist ein Kernnutzenaspekt, den die Daten als Ergebnis der Digitalisierung der Produktion ermöglichen“, so Heiko Miertzsch CEO, des Kasseler Datenanalysespezialisten eoda. Die Analyse von Maschinendaten und externen Daten ermöglicht es, Muster im Verhalten der Maschinen zu entdecken und zukünftige Zustände wie Ausfälle zu prognostizieren. „Das ist der Grundstein für eine höhere Planungssicherheit und eine effizientere Wartung“, erklärt Miertzsch die Möglichkeiten hochwertiger Datenanalyse für Predictive Maintenance.

Predictive Maintenance als innovatives Instandhaltungskonzept (Bild © everythingpossible / fotolia.com)

Predictive Maintenance als innovatives Instandhaltungskonzept (Bild © everythingpossible / fotolia.com)

Weiterlesen

Text Mining zur Prognose der Strompreisentwicklung

Nicht zuletzt die Energiewende sorgt bei Energieversorgern für Veränderungen und Herausforderungen. Den Anteil erneuerbarer Energien von heute 12 Prozent auf fast 40 Prozent im Jahr 2020 zu verdreifachen, ist nur eines der Ziele, die sich ein führender Energieversorger gesetzt hat.

Um Effizienzpotentiale zu heben und neue Geschäftsfelder zu erschließen setzt der Energieanbieter verstärkt auf Data Mining und Predictive Analytics. Möglichst zahlreiche und vielfältige Daten sollen analysiert werden, um die Entscheidungen im Unternehmen zielgerichtet und belastbar zu unterstützten. Konkret werden beispielsweise für den Stromhandel minutenaktuell die Meldungen der Nachrichtenagentur Reuters erfasst und einzelne Nachrichten auf ihre Relevanz für die Entwicklung der Energiepreise untersucht.

Ein integriertes System soll zukünftig die Stromhändler bei der Selektion der relevanten Nachrichten unterstützen.

Darstellung der Strompreisentwicklung

Darstellung der Strompreisentwicklung

Weiterlesen

eoda verlängert Gold Partnernerschaft mit Oracle – Fokus auf Data Mining und Predictive Analytics

Der Datenanalysespezialist eoda und das amerikanische Unternehmen Oracle verlängern ihre Partnerschaft.  Das Kasseler Unternehmen unterstützt den weltweit führenden Hersteller von Datenbanksystemen auch weiterhin als Systemintegrator. Auf Basis der hochwertigen Oracle Produkte entwickelt eoda individuell angepasste Lösungen für die Anwender mit einem Schwerpunkt auf Data Mining und Predictive Analytics. Im Fokus der Partnerschaft steht dabei die Verknüpfung der Oracle Database mit der Open Source Statistiksprache R. „R entwickelt sich zunehmend zur plattformübergreifenden Lingua franca für Datenanalysten und bietet umfassende und leistungsfähige Methoden für die Analyse und Visualisierung von Daten, Data Mining und Predictive Analytics“, erläutert Heiko Miertzsch, CEO von eoda, die Vorteile von R. eoda als erstes deutsches Mitglied der R-Foundation, die sich für die Verbreitung von R einsetzt, gilt als einer der Vorreiter für  den kommerziellen Einsatz von R im deutschsprachigen Raum.

Mit R die Oracle-Datenbanken um Verfahren zu Predictive Analytics und Data Mining erweitern

Als einer der ersten großen Softwarehersteller hat Oracle das Potenzial von R erkannt und die Integration der Statistiksprache in die Datenbanksysteme vorangetrieben. Mit Oracle Advanced Analytics erweitert Oracle die Datenbanken zu einer umfassenden Plattform für Data Mining und Predictive Analytics. Teil von Oracle Advanced Analytics ist die Komponente Oracle R Enterprise. Diese integriert die Funktionen der R-Programmiersprache und verlagert dadurch die Berechnungen in die Datenbank und ermöglicht so “In Database Analytics”.  Gerade in Zeiten von Big Data und der damit verbundenen Komplexität der Analysen stellt die Begrenzung des lokal vorhandenen Arbeitsspeichers einen entscheidenden Engpass dar. Die Verlagerung der Berechnungen in die Oracle Datenbank und die Nutzung der dort vorhandenen Speicherkapazitäten löst dieses Problem.

Weiterlesen

eoda News 2014 Nr. 1

Wir von eoda wünschen unseren Lesern ein Frohes Neues Jahr und möchten in unserem ersten Blog Beitrag dieses Jahr auf wichtige und spannende Entwicklungen rund um die Themen eoda, R und Datenanalyse aufmerksam machen und einen Ausblick auf zukünftige Aktivitäten und Ereignisse geben.

eoda erweitert die Service Plattform „Results as a Service“

associateR, signatuRe und textmineR – so lauten die Namen der neuen Anwendungen auf unserer eoda Service Plattform. Dahinter verbergen sich webbasierte Lösungen zur Warenkorbanalyse, zur automatischen Signaturerfassung und zur Analyse unstrukturierter Texte. Diese Module erweitern unser Portfolio und bieten genau wie die bereits bestehenden Anwendungen die Möglichkeit auf Basis eines skalierbaren Frameworks individuelle und hochwertige Lösungen für unsere Kunden zu schaffen. „Results as a Service“ erschließt die Potenziale von Big Data mit den Möglichkeiten von Cloud Computing und ermöglicht die Entwicklung maßgeschneiderter Apps zur Datenanalyse – für jede Datenmenge, jede Laufzeit, auf einer öffentlichen oder privaten Cloud-Plattform nach Wahl.

Unsere Case Study zur CRM Daten Konsolidierung verdeutlicht im Folgenden ein konkretes Anwendungsszenario für die „Results as a Service“-Anwendung fuzzychekC.

Case Study: CRM Daten Konsolidierung nach Unternehmensfusion

Eine Übernahme oder eine Fusion stellt einen Meilenstein in der wirtschaftlichen Entwicklung eines Unternehmens dar, der mit vielen Vorteilen verbunden sein kann. Um diese Vorteile auch zu erzielen bedarf es einer Lösung der Aufgaben, die mit einer solchen Strukturveränderung einhergehen. Die Zusammenführung der Datenbestände ist dabei von zentraler Bedeutung für das „neue“ Unternehmen, denn die Daten stellen wichtige Assets dar.

eoda hat mit dem Modul fuzzychekC der hauseigenen Results as a Service Plattform die CRM Daten Konsolidierung für eine international tätige Hotelkette durchgeführt. Dabei hat eoda den gesamten Prozess vom Datenexport, über die Steigerung der Datenqualität bis zum Import in das finale Salesforce CRM-System betreut. Bei der Datenintegration unterstützte Open Studio von dem eoda Partner Talend.

Die so vollständig zusammengeführten historischen Daten inklusive der notwendigen Entitäten wie Aktivitäten und Dokumente in Verbindung mit der Verbesserung der Datenqualität stellen eine echte Verbesserungen für alle kundennahen Prozesse dar.

Zur Case Study.

R-Akademie: eoda baut das umfassende deutschsprachige Trainingsprogramm für R weiter aus

Die freie Statistiksprache R gewinnt auch im deutschsprachigen Raum immer mehr an Bedeutung. R kommt sowohl in wissenschaftlichen Instituten wie auch in Behörden und Unternehmen immer öfter zur Analyse kleiner und großer Datenmengen zum Einsatz. Die eoda R-Akademie passt sich dieser Entwicklung an und erweitert sein bewährtes Trainingsprogramm für das Jahr 2014 um die folgenden fünf weiteren Kurse:

  • Programmieren mit R II
  • Reproducible Research
  • Big Data mit R
  • Hadoop mit R
  • Angewandte Statistik im Qualitätsmanagement mit R

Diese Kurse sollen insbesondere fortgeschrittenen R-Nutzern ein attraktives Angebot rund um die freie Programmiersprache bieten. Natürlich wird der ganzheitliche Charakter der R-Akademie gewahrt und auch Einsteiger finden den passenden Kurs.

Eine Anmeldung ist ab sofort möglich. Für Frühbucher und Universitätsangehörige werden günstige Sonderkonditionen angeboten.

Weitere Informationen hier.

Weiterlesen

eoda baut das umfassende deutschsprachige Trainingsprogramm für R weiter aus

Dass die freie Statistiksprache R auch im deutschsprachigen Raum zunehmend an Beliebtheit gewinnt, hat mehrere Gründe. Neben kommerziellen Lösungen wie SPSS, Stata oder SAS kommt sowohl in wissenschaftlichen Instituten wie auch in Behörden und Unternehmen immer öfter R zur Analyse der kleinen und großen Datenmengen zum Einsatz.

“Wir bekommen zunehmend Anfragen von Institutionen und Unternehmen aller Branchen, die R für ad-hoc Analysen einsetzen oder auch analytische Bausteine für ihre Geschäftsanwendungen mit R entwickeln möchten. Der ganzheitliche Charakter des Trainingsprogramm R-Akademie befähigt die Anwender das riesige Potenzial von R zu nutzen und gewinnbringend im eigenen Umfeld einzusetzen.” erklärt Heiko Miertzsch, CEO von eoda, die Philosophie der R-Akademie.

Das der Umfang von anfallenden Daten in allen erdenklichen Anwendungsgebieten steigt, ist mittlerweile allgemein bekannt. Die steigende Informationsflut bietet die Chance, neues Wissen aus den Daten zu generieren. Mitunter fällt es mit vorhandenen Tools schwer, die relevanten Informationen zur Entscheidungsfindung rechtzeitig zur Hand zu haben oder mit Hilfe von Data Mining Muster zu erkennen und mit Predictive Analytics Prognosen zu erstellen.

Weiterlesen

eoda erweitert Jaspersoft Business Intelligence Lösungen um Data Mining und Predictive Analytics mit R

Maßgeschneiderte Dashboards zur interaktiven Visualisierung von Analyseergebnissen steigern die Benutzerfreundlichkeit.

Der Datenanalysespezialist eoda schließt eine Partnerschaft mit Jaspersoft, dem Lösungsanbieter für die Intelligenz innerhalb von Anwendungen und Geschäftsprozessen. Als Integrationspartner entwickelt eoda auf Basis der hochwertigen Jaspersoft-Software maßgeschneiderte Lösungen für anspruchsvolle Business Intelligence Anwender. Als europaweit erster Jaspersoft-Partner erweitert eoda die Reporting- und Business Intelligence Funktionalitäten der Jaspersoft BI Suite mit Hilfe der Open Source Statistiksprache R um vielfältige Funktionen aus den Bereichen Data Mining und Predictive Analytics.

eoda vertraut mit Jaspersoft auf eine der flexibelsten BI-Suites der Welt

Jaspersoft bietet eine skalierbare und flexible BI-Plattform, die für Cloud, Mobile und Big-Data- Szenarien sowie vielfältige Einsatzzwecke konzipiert ist. Die Flexibilität der Open Source Lösungen ermöglicht die bestmögliche Integration in bestehende und zukünftige IT-Umgebungen. Neben der Qualität der Lösungen ist die Offenheit der Anknüpfungspunkt für eoda: Das Kasseler Unternehmen erweitert die Funktionen von Jaspersoft mit einer R-Schnittstelle um individuelle Lösungen für Data-Mining und Predictive Analytics. Als erstes deutsches Unternehmen in der R-Foundation steht eoda für die Nutzung von R in Business Umfeld. „Jaspersoft bietet exzellente Integrationsmöglichkeiten für R. Jaspersoft und R sind in ihrem Bereich führend in Preis und Leistung. Die sich ergänzenden Anwendungsbereiche und Funktionen stellen für Anwender kalkulierbare und nachhaltige Vorteile dar”, erläutert Heiko Miertzsch, CEO von eoda, die Idee hinter der Partnerschaft.

Weiterlesen