R ist eines der wichtigsten Werkzeuge im Daten Journalismus

Vergangenes Wochenende wurde, während der School of Data Jounalism des Internationalen Festivals für Journalismus, das Data Journalism Handbook vorgestellt. Daten Journalismus gewinnt vor allem in den USA oder dem Vereinigten Königreich immer stärker an Bedeutung. Im Gegensatz zum klassischen Journalismus, an dessen Anfang immer eine Geschichte steht (Story Driven Journalism), lässt der Daten Journalismus, Daten gewissermaßen die Geschichte erzählen.

Aus einer Idee während eines 48 stündigen Workshops, ist nun das Handbuch für Datenjournalisten entstanden. Ein kooperatives Werk verschiedener Journalisten, mit einer gemeinsamen Leidenschaft für Daten Journalismus. Zu den Autoren aus dem deutschsprachigen Raum gehören u. a. Sasha Venohr von Zeit Online (https://twitter.com/#!/venohr), Mirko Lorenz von der Deutschen Welle (http://twitter.com/#!/mirkolorenz) und Lorenz Matzat von OpenDataCity (http://twitter.com/#!/lorz).

Ein frühes Beispiel für Daten Journalismus ist die Pulitzer Preis prämierte Reportage über die 1967er Detroit Riots, von Philip Meyer. Den ursprünglichen Eindruck, dass die Aufständigen sich hauptsächlich aus Ärmeren Menschen der untersten Bildungsschicht und Farbigen aus dem Süden der Vereinigten Staaten zusammensetzten, widerlegte Meyer durch eine Umfrage. Diese ergab, dass eine Beteiligung, an den Aufständen von College Absolventen, genauso wahrscheinlich war, wie die von Highschool Abbrechern, die Beteiligung von Menschen aus dem Süden galt sogar als weniger wahrscheinlich.
Während Philip Meyer seine Reportage nur mit sehr beschränkten Hilfsmitteln erstellen konnte, wird heute die Arbeit von Daten Journalisten durch den technischen Fortschritt erheblich erleichtert. Daten sind zunehmend öffentlich und immer leichter zugänglich. Hier bieten Datenportale wie DataMarket einen guten Einstieg. Die Analyse von großen Datensätzen ist für moderne PCs kein Problem mehr, und das Internet ist eine riesen Erleichterung für die Recherche von Daten oder Zusammenhängen.

Aktuelle Beispiele für gelungenen Datenjournalismus
Eine bedeutende Rolle spielt der Data Blog des Guardians. Dort finden sich zahlreiche interessante Beispiele für Datenjournalismus, aufbereitet in ansprechenden Grafiken. Die passenden Daten dazu werden zusätzlich über den eigenen DataStore zugänglich gemacht.

In Deutschland findet sich auf Zeit Online mit dem Data Blog ein Blog der sich dediziert mit Daten Journalismus und Open Data auseinandersetzt.
Hervorstechende Beispiele für Deutschen Datenjournalismus sind u.a. der Zugmonitor der Süddeutschen Zeitung, die Fluglärmkarte der Taz oder auch die Aufbereitung des Spiegels, der von Wikileaks veröffentlichten U.S. Depeschen.

Für ihren Zugmonitor, erfasst die Süddeutsche Zeitung den kompletten Deutschen Fernverkehr in Echtzeit und visualisiert diesen ansprechend auf einer Deutschland Karte, Verspätungen werden farblich hervorgehoben.

R und Datenjournalismus
Ein Kapitel des, frei zugänglichen Handbuchs für Datenjournalisten, fragt nach den favorisierten Tools der Journalisten. Die Hälfte der Journalisten nennt R als eines der favorisierten Werkzeuge zur Analyse von Daten. Gregor Aisch von der Open Knowledge Foundation (http://twitter.com/#!/driven_by_data) hält R für das leistungsfähigste Tool, vor allem zur Analyse großer Datensets. Im Gegensatz zu Tabellenkalkulationen erlaubt R eine Scriptorientierte Arbeitsweise, anhand derer sich Vorgänge schnell und einfach reproduzieren lassen.

R kann die Journalisten bei allen notwendigen Schritten unterstützen. Von Bezug der Daten, über verschiedenste Quellen, die eigentliche Auswertung bis hin zu einer ansprechenden Visualisierung. eoda zeigt hier am Beispiel der Daten des Zugmonitors wie man offene Daten für eigene Zwecke mit R nutzen kann. Zu den Möglichkeiten der Visualisierungen mit R finden sich in älteren Posts Beispiele.

Erfolgreich genutzt wird R von der Redaktion der NY-Times. Nur Stunden nach dem Tod von Michael Jackson, veröffentlichte die NY-Times diese Grafik. Hier wird die Performance von Jacksons Liedern in den Billboard Top 100 abgebildet. Nach Aussage von Amanda Cox, Grafik Editor der NY Times wurde diese Anwendung vollständig in R erstellt.

 

Excel Reports mit R erstellen am Beispiel des Zugmonitors der SZ

Daten im Überfluss sind gleichzeitig Fluch und Segen unserer Zeit. Mit dem Zugmonitor hat die Süddeutsche Zeitung ein besonders anschauliches Projekt initiiert, das die Möglichkeiten und den Nutzen von „BigData“ aufzeigt. eoda erklärt in einem Screecast, wie man die Daten mit Hilfe R in Echtzeit für Excel-Nutzer aufbereiten kann.

Beim Zugmonitor wird aus den offiziellen Angaben der Bahn eine Live-Karte zu Verspätungen im Fernverkehr dargestellt. Zusätzlich werden die Rohdaten per API von OpenDataCity zur Verfügung gestellt. Dabei können beträchtliche Datenmengen zusammen kommen, denn pro Tag kann man hier die Daten für ca. 1000 Zugeinfahrten abfragen. Die Analyse dieser Rohdaten ist ein schönes Beispiel für „Business Analytics“. Man kann auf Basis dieser Daten verschiedenen Fragestellungen nachgehen:

  • Welche Muster gibt es in den Verspätungen?
  • Welche Häufungen gibt es in den Ursachen? Wann und auf welchen Strecken?
  •  Wie entwickeln sich die Verspätungen für Zeiträume, Orte oder Züge?

eoda setzt bei Datenanalyse auf R, die zur Zeit vermutlich mächtigste Sprachen zur umfassenden Datenanalyse, die gerade rapide an Verbreitung zunimmt. Dieser Trend wird aktuell dadurch untermauert, dass SAP scheinbar plant, seine „Predicitive Analytic Lösungen“ für R zu öffnen.

In einem Sreencast unter zeigen wir, welche Möglichkeiten sich R-Nutzern bieten, die Daten des Zugmonitors auszulesen, aufzubereiten und die Ergebnisse Anwendern als Microsoft Excel Dateien zur Verfügung zu stellen. Dabei sollte berücksichtigt werden, dass dies nur ein ganz kleiner Ausschnitt der Möglichkeiten ist, die R mit seinen mittlerweile über 3700 Erweiterungspaketen bietet.

 

Webbasierte Business Anwendungen mit R zur Visualisierung von Social Media Analysen

Analysen und Reporting, in einer ansprechenden visuellen Form dargestellt, ermöglichen breiten Nutzergruppen den Zugang zu großen und komplexen Daten. Dashboards – in Echtzeit aufbereitete und webbasiert zur Verfügung gestellte Ergebnisse ermöglichen schnelle Reaktionszeiten.

R in Verbindung mit modernen Web-Technologien bietet vielfältige und umfassende Möglichkeiten für Business Analytics Anwendungen.

Ein Einsatzfeld zur Visualisierung der Ergebnisse von Analysen auf großen Datenbeständen sind soziale Netzwerke. Kunden, Interessenten, Multiplikatoren oder auch Wettbewerber senden Nachrichten über Twitter, Facebook und andere Plattformen an ihre Freunde und Follower. So ist es durchaus interessant, die Häufigkeit, die Inhalte oder die Tonalität solcher Nachrichten – beispielsweise über das eigene Unternehmen, eine Marke oder ein Fachthema – zu analysieren. Ein prädestiniertes Beispiel einer solchen Analyse sind Twitter-Nachrichten oder „Twitter-Gespräche“. Hier ermöglichen analytische Arbereitung und die passenden Algorithmen einen Blick auf die Zusammenhänge von Themen, Begriffen, Hashtags oder Autoren. Diese gewonnenen Informationen können je nach Fragestellung entsprechend aufbereitet und dargestellt werden.

Twitter Monitor als Web Applikation mit R

Twitter Monitor als Web Applikation mit R

Was sagt zum Beispiel die Community jetzt gerade jetzt über BigData? Welche Themen sind gerade angesagt? Wer kommunizert?

eoda hat eine Applikation entwickelt, die als ein praktisches Beispiel eine solchen Datenaufwertung verdeutlicht. Der „BigData Twitter-Monitor“ visualisiert die  Anzahl von Twitter-Feeds zu dem Hashtag „BigData“ im Verhältnis zu den Begriffen „openaccess“ und „opendata“. Zusätzlich werden die in diesem Kontext (via Hashtag) gekennzeichneten Begriffe nach ihrer Häufigkeit dargestellt.

Über R

R ist eine Open-Source Programmiersprache zur statistischen Datenanalyse und
–visualisierung. In vielen Bereichen ist R den kommerziellen Softwarelösungen
überlegen. Dazu zählen vor allem die Möglichkeiten zur Visualisierung. Gerade
in Verbindung mit der einfachen Möglichkeit zur Anbindung diverser Datenquellen
aus verteilten Datenbanken, Internet etc. eröffnen sich so innovative Möglichkeiten des Informationsgewinns und der Darstellung von Ergebnissen. Führende Anbieter integrieren R in ihre Lösungen oder bieten Schnittstellen zu R.

eoda nutzt R auch als Business Analytics Schicht um Collaborative BI Lösungen zu entwickeln. Die intelligente Verbindung aus den umfangreichen Möglichkeiten zur Datenvisualisierung und den statischen Methoden von R mit modernen Web Technologien schafft sehr flexiblen Lösungen für Business Analytics zu niedrigen Gesamtkosten.

Pressemitteilung: Revolution Analytics und eoda geben Partnerschaft bekannt

 

eoda bietet analytische Software-Lösungen basierend auf „Revolution R Enterprise“

20.02.2012, Kassel, Deutschland. Der auf Lösungen für „High Performance Analytics“ spezialisierte Anbieter Revolution Analytics und der deutsche Datenanalyse-Spezialist eoda geben ihre Partnerschaft bekannt. Der IT-Dienstleister eoda, Kooperationspartner der Universität Kassel und Vorreiter in Deutschland für die Statistik-Sprache R im Business-Umfeld, bietet Consulting, Training und Integrationsleistungen zu R. Die Wissenschaftler und IT-Experten von eoda sind spezialisiert auf die Analyse von strukturierten und unstrukturierten Daten. Als Vertriebs- und Beratungspartner entwickelt eoda Lösungen zur Datenanalyse auf der Basis von Revolution R Enterprise und leistet deutschsprachigen Support für die Produkte von Revolution Analytics.

„Die Partnerschaft mit eoda ist ein weiterer Schritt im Rahmen unserer internationalen Expansion“ sagt David Smith, Vice President Marketing und Community von Revolution Analytics. „Wir teilen die gleiche Vision von High Perfomance Analytics, der Verbindung aus High Performance Computing und hochwertiger Datenanalyse. Wir teilen die gleiche Leidenschaft für R und das einzigartige Potenzial dieser Sprache, Innovationen in der Datenanalyse für Unternehmen verfügbar zu machen. Wir unterstützen beide die dynamische Community der R-Entwickler und Nutzer, die eine breite Palette an Anwendungen und Verfahren zur wissenschaftlichen Datenanalyse entwickelt.“

Für Datenanalyse begeisterte Anwender profitieren durch die Partnerschaft von der lokalen Präsenz der Spezialisten von eoda, die in ein weltweites Netz aus Analyse-Experten eingebunden sind.

Revolution Analytics und eoda geben Big Data einen Sinn

Kürzere Produktlebenszyklen, Individualisierung sowie die fortschreitende Digitalisierung erhöhen die Menge der vorhandenen Daten und gleichzeitig die Notwendigkeit, intelligent mit dem Rohstoff Daten umzugehen. Social Media und die Vernetzung der Gegenstände untereinander, wie in der Logistik, treiben die Entwicklung voran. Für Unternehmen ist Big Data das Synonym für die beispiellosen Möglichkeiten, nützliche Erkenntnisse aus großen Datenmengen zu gewinnen. Die Chancen und die Herausforderungen, die Big Data darstellt, sind das Spezialgebiet von eoda.

„Eine logistische Regression, über eine Million Zeilen, die in Prognosen oder Ratings zum Einsatz kommen kann, hat eine inhaltliche – also handwerkliche – und eine technologische Dimension“, stellt Heiko Miertzsch, Geschäftsführer von eoda, die Herausforderung für Anwenderunternehmen dar. Die Partnerschaft führt ein leistungsfähiges modernes Framework zur Datenanalyse basierend auf R mit den analytischen Erfahrung von eoda zusammen. Miertzsch: „Unsere Analyse-Spezialisten helfen Anwendern, die richtigen Fragen zu erarbeiten und die Ergebnisse der Analysen zu interpretieren. Revolution R Enterprise von Revolution Analytics ist dabei ein mächtiges Werkszeug, das Ergebnisse in Sekunden statt Tagen liefert – ohne teure Hardware. Zusammen bieten wir vergleichsweise günstige TCO und so auch die Möglichkeit, mit verschiedenen Modellen zu experimentieren, bevor man den optimalen Ansatz wählen kann.“

Über:

R – „die mächtigste Programmiersprache zur Datenanalyse

R ist eine Software zur Datenanalyse und Visualisierung. 1993 an der Universität von Auckland in Neuseeland entwickelt, steht R für einen völlig neuartigen Ansatz, mit Daten aller Art umzugehen. R bietet eine Vielzahl von statistischen Methoden (lineare und nichtlineare Modellierung, klassische statistische Testverfahren, Zeitreihenanalyse, Clusteranalysen etc.) und Werkzeuge zur grafischen Visualisierung. Dabei ist R in höchstem Maße erweiterbar. Eine der Stärken von R ist die Einfachheit, mit der sich perfekt gestaltete publikationsreife Grafiken erstellen lassen. Und während die Standardeinstellungen schon sehr gute Ergebnisse liefern, bleibt dem Benutzer die volle Kontrolle über alle Elemente, um eine Grafik an die eigenen Anforderungen anzupassen. R wird weltweit von schätzungsweise 2 Millionen Nutzern in Unternehmen und Wissenschaft genutzt. Die Community hat mehr als 2.500 Pakete entwickelt, die Bausteine zur Erstellung analytischer Modelle darstellen.

Revolution Analytics

Revolution Analytics ist der führende Anbieter für kommerzielle Software und Services basierend auf dem Open Source Projekt R. Das Unternehmen verbindet hohe Leistungsfähigkeit, Produktivität und Verfügbarkeit mit R. Das Kernprodukt Revolution R Enterprise erfüllt die Anforderungen der großen Unternehmen aus den Bereichen Finanzdienstleistungen, Biowissenschaften, Handel, Industrie und Medien an eine Software zur Datenanalyse. Eingesetzt von Branchenführern wie Google, Lloyds und der New York Times hat sich R zu einem Standard für innovative statistische Datenanalyse durchgesetzt. Revolution Analytics unterstützt das anhaltende Wachstum der R Community durch das Sponsoring weltweiter Nutzergruppen und dem Portal Inside-R.org, sowie der freien Version von Revolution R Enterprise für Studenten und Mitarbeiter an Universitäten.

eoda

eoda ist ein IT-Dienstleister, der auf die Analyse von strukturierten und unstrukturierten Daten und die Visualisierung von Ergebnissen spezialisiert ist. Das Portfolio umfasst Beratung, Software-Entwicklung, Integration und Training. eoda ist ein interdisziplinäres Team aus Ingenieuren, Wirtschafts- und Sozialwissenschaftlern sowie Statistik- und IT-Experten. Die Leistungen erstrecken sich über den gesamten Workflow von der Datenerfassung/-erhebung über die Analyse bis zur Interpretation der Ergebnisse. Wir kombinieren fundiertes Wissen über Geschäftsprozesse mit der kompetenten Anwendung der richtigen Analyseverfahren. So schaffen wir strategischen Mehrwert für Unternehmen. Wir helfen Entscheidern, in der Datenflut den richtigen Kurs zu setzen, um Wissen und Chancen zu erschließen. Mit der R-Akademie bietet eoda ein integriertes ganzheitliches Schulungs- und Weiterbildungskonzept für die Welt der Datenanalyse mit R an. Ausgerichtet auf die Bedürfnisse von Anwendern in Unternehmen werden schnell und umfassend praxisrelevante Inhalte vermittelt.

Geodatenanalyse und -visualisierung mit R

Ein faszinierendes Beispiel für die Möglichkeiten der Datenvisualisierung mit R hat der Brite James Cheshire geliefert. Er nutzte die Daten des Fahrradverleihs „Barclays Cycle Hire“ um eine grafische Darstellung der beliebtesten Fahrradrouten Londons zu erstellen. Cheshire nutzte dafür die Programmiersprache R und das R-Paket ggplot2:

Wer das ganz nett findet, aber nach praktischen Anwendungsmöglichkeiten dieser Arbeit fragt, dem liefert Cheshire die Antwort gleich mit: In einem zweiten Schritt kombinierte er seine Arbeit zur Nutzung von Fahrradwegen mit öffentlichen Daten zur Schadstoffbelastung in London. Anhand der neuen Karte kann nun untersucht werden, in welchen Regionen Fahrradfahrer bereits besonders belastete Routen vermeiden können und wo noch nachgebessert werden sollte, um die Stadt fahrradfreundlicher zu gestalten:

R auf dem World Economic Forum

Der Environmental Performance Index (EPI) ist ein Versuch, die ökologische Leistungsbilanz von Staaten und Unternehmen quantitativ darzustellen und zu vergleichen. Entwickelt wurde der Index vom Fachbereich Environmental Sustainability der Yale University. Beim diesjährigen World Economic Forum hat Professor John Emerson die aktuellen Ergebnisse vorgestellt.
Auf der Website der Yale University sind die in R analysierten Ergebnisse dargestellt.


Termine der R-Akademie in 2012

eoda hat für das laufende Jahr ein interessantes Kursprogramm zum Thema „R“ zusammengestellt.

R etabliert sich neben den kommerziellen Softwarelösungen SPSS, Stata und SAS, zunehmend – auch in Deutschland – als alternative Plattform zur Datenanalyse. R wird gleichermaßen von Wissenschaftlern als auch Praktikern in den Unternehmen eingesetzt.

Die R-Akademie von eoda ist ein modulares Kursprogramm für die Statistikumgebung R mit regelmäßigen Veranstaltungen. Unsere Trainer arbeiten seit über 10 Jahre in der Datenanalyse. Unsere Trainings zu R an Universitäten und Graduiertenzentren werden regelmäßig sehr gut bewertet.

R Akademie - Modulares Kursprogramm für R

R Akademie - Modulares Kursprogramm für R

Hier finden Sie eine Auswahl unserer Referenzen, die Themen- sowie Termin-Übersicht für 2012.

R-Akademie wird sehr gut bewertet

„Datenanalyse mit R“ stand ganz oben auf der Agenda der Einführungsveranstaltung der R-Akademie. Teilnehmer aus verschiedenen Branchen und Fachgebieten nahmen an der Weiterbildungsveranstaltung zur Statistik-Software R teil. So waren unter anderem Maschinenbauer, Stadtplaner, Nanostrukturwissenschaftler oder Softwareentwickler mit von der Partie. Auch das Karrierelevel der Teilnehmer war sehr unterschiedlich und reichte von Doktoranden bis hin zum Referatsleiter. Das breite Teilnehmerspektrum zeigt, wie sich R neben den kommerziellen Softwarelösungen SPSS, Stata und SAS, zunehmend als Standardsoftware für Datenanalyse sowohl in der Wissenschaft als auch in der freien Wirtschaft etabliert. Weiterlesen

Enterprise Wiki + Business Intelligence = Sales empowerment

Auszeichnung der Lösung von bronz[soft} media architects und eoda für Siemens-Tochter beim „Sales Enablement Best Practice Award 2011“ der Experton Group und der Computerwoche

  • Der Business Intelligence Berater eoda und die Medienarchitekten von bronz[soft} haben für die Siemens IT-Tochter (mittlerweile Atos) ein Portal auf Basis eines Unternehmens Wiki entwickelt, das im Rahmen des “Sales Enablement Best Practice Award 2011” mit Platz 2 ausgezeichnet wurde.
  • Nach Einschätzung des Beratungshauses Experton Group wächst die Anzahl der Produkt- und Marketingdokumente in Großunternehmen pro Jahr um 40%.
  • Frage: Wie sollen Vertriebsmitarbeiter vor diesem Hintergrund effizient auf die wichtigen Informationen zugreifen, um eine umfassende Kundenbetreuung zu garantieren

Schnelle Innovationszyklen, Variantenvielfalt, segmentspezifische Produkte, vielfältige Medientypen – die Gründe für die Zunahme der Informationen im Vertriebs- und Marketing-Umfeld sind vielfältig. Gleichzeitig wächst der Druck auf den Vertrieb, die entsprechenden Inhalte schnell zu bearbeiten und alle relevanten Informationen passend parat zu haben, um die Kunden bestmöglich zu betreuen. Weiterlesen

Prognose der OB-Wahl in Kassel

 

Klassische Wahlbefragungen stehen vor dem Problem des gesellschaftlichen Wandels.Vor diesem Hintergrund fand in Deutschland erstmals eine Wahlwette gemäß der Theorie zur „Weisheit der Vielen“ auf kommunaler Ebene statt: Kann die Masse ein Kommunalwahlergebnis treffend vorhersagen?. Insgesamt 1.889 Teilnehmer haben sich an der Wahlwette beteiligt. Das vorhergesagte Ergebnis liegt sehr nahe an der Realität. Die durchschnittliche absolute Abweichung beträgt lediglich 1,4 Prozentpunkte.

Das Ergebnis der Wahlwette