Daten im Überfluss sind gleichzeitig Fluch und Segen unserer Zeit. Mit dem Zugmonitor hat die Süddeutsche Zeitung ein besonders anschauliches Projekt initiiert, das die Möglichkeiten und den Nutzen von „BigData“ aufzeigt. eoda erklärt in einem Screecast, wie man die Daten mit Hilfe R in Echtzeit für Excel-Nutzer aufbereiten kann.
Beim Zugmonitor wird aus den offiziellen Angaben der Bahn eine Live-Karte zu Verspätungen im Fernverkehr dargestellt. Zusätzlich werden die Rohdaten per API von OpenDataCity zur Verfügung gestellt. Dabei können beträchtliche Datenmengen zusammen kommen, denn pro Tag kann man hier die Daten für ca. 1000 Zugeinfahrten abfragen. Die Analyse dieser Rohdaten ist ein schönes Beispiel für „Business Analytics“. Man kann auf Basis dieser Daten verschiedenen Fragestellungen nachgehen:
- Welche Muster gibt es in den Verspätungen?
- Welche Häufungen gibt es in den Ursachen? Wann und auf welchen Strecken?
- Wie entwickeln sich die Verspätungen für Zeiträume, Orte oder Züge?
- …
eoda setzt bei Datenanalyse auf R, die zur Zeit vermutlich mächtigste Sprachen zur umfassenden Datenanalyse, die gerade rapide an Verbreitung zunimmt. Dieser Trend wird aktuell dadurch untermauert, dass SAP scheinbar plant, seine „Predicitive Analytic Lösungen“ für R zu öffnen.
In einem Sreencast unter zeigen wir, welche Möglichkeiten sich R-Nutzern bieten, die Daten des Zugmonitors auszulesen, aufzubereiten und die Ergebnisse Anwendern als Microsoft Excel Dateien zur Verfügung zu stellen. Dabei sollte berücksichtigt werden, dass dies nur ein ganz kleiner Ausschnitt der Möglichkeiten ist, die R mit seinen mittlerweile über 3700 Erweiterungspaketen bietet.
Mit “Reproducible Research” können Sie auf unserer Results as a Service Plattform einen individuellen Report für einen Bahnhof oder eine Strecke erstellen.
