Warum die Bahn nicht zu spät kommt – Data Mining am Beispiel Zugmonitor

Nur wenige Themen werden von der mobilen Gesellschaft ähnlich oft und gern diskutiert wie die Servicequalität der Deutschen Bahn. Die Temperatur im Abteil im Sommer oder im Winter, die Kompetenz und Freundlichkeit der Bahnmitarbeiter und vor allem die Pünktlichkeit sind beliebte Qualitätskriterien der Bahn, die von Bahnanhängern wie Kritikern seit jeher kontrovers diskutiert werden.

Als ein interessantes Beispiel des neu aufkommenden Trends des Datenjournalismus wird auf zugmonitor.sueddeutsche.de der deutsche Fernverkehr in Echtzeit erfasst und für eine Weiterverarbeitung zur Verfügung gestellt. eoda hat auf Basis der Daten des Zugmonitors der Süddeutschen Zeitung den Fernverkehr der Deutschen Bahn untersucht und erste einfache Data Mining Verfahren angewendet.

In den Daten sind auch die Gründe zu finden, die zur Verspätung eines einzelnen Zuges geführt haben. Das lädt zur Diskussion über die Ursachen der Verspätungsquote der Bahn ein. In diesem Zusammenhang könnte  eine Frage lauten, welchen Einfluss plötzliche von außen einwirkende unvorhersehbare Ereignisse auf die Qualität der Leistungen der Bahn haben.

Eine einfache Modellierung

Es ist nachvollziehbar, dass sich in dem umfangreichen und komplexen Fahrplan die Resultate einzelner Ereignisse fortpflanzen. Ein umgestürzter Baum führt zur Sperrung eines Streckenabschnittes. Die notwendigen Umleitungen haben Auswirkungen auf andere Abschnitte im gesamten Netz sowie möglicherweise auf weitere Aspekte der Leistungserbringung. Bleibt der Getränkenachschub irgendwo auf der Strecke, fehlt vielleicht in einem anderen Zug das kühle Bier.

Zur Beschreibung solcher komplexen Leistungsaspekte werden üblicherweise Kennzahlenpyramiden gebildet, die die einzelnen Qualitätskennzahlen miteinander in Beziehung setzen.

Um der Frage nachzugehen, wie sich die verschiedenen Verspätungsursachen auf die Leistung der Bahn auswirken, hat eoda eine Vereinfachung vorgenommen und eine einzige Qualitätskennzahl definiert:  Die durchschnittliche Verspätungsquote je Tag. Für diese Kennzahl wurde anhand des vorliegenden Datenmaterials geprüft, welche Rolle unerwartete und von der Bahn nicht zu verantwortende Gründe spielen.

Die Süddeutsche Zeitung unterteilt die Verspätungsgründe in zwei Kategorien: Gründe, bei denen die Hauptverantwortung meist bei der Bahn liegt und Gründe, für die die Bahn nichts kann. „Meist Bahn“ sind dabei Ursachen wie Streckensperrungen oder Gleiswechsel, „nicht Bahn“ sind beispielsweise witterungsbedingte Störungen oder Notarzteinsätze. Die vollständige Aufstellung ist hier zu finden.

Zusammenhang zwischen Pünktlichkeit und unvorhersehbaren Ereignissen

Die folgende Grafik bildet den Zusammenhang ab zwischen der durchschnittlichen Verspätungsquote eines Tages und dem Anteil der Verspätungen, die auf nicht von der Bahn vorhersehbare Einflüsse von außen zurückzuführen sind.

Die Datenbasis sind die Zugausfahrten im Fernverkehr von Oktober 2011 bis Mai 2012. In diesem Zeitraum wurden insgesamt 186.363 Fahrten aufgezeichnet, im Durchschnitt sind das 767 Fahrten pro Tag.

Jeder Punkt repräsentiert einen Tag. Auf der Y-Achse ist der Anteil der verspäteten Fernzüge abgetragen. Auf der X-Achse ist der Anteil an der Verspätungsquote abgetragen, den unvorhersehbare Ereignisse an dem jeweiligen Tag haben. Die Farbe eines Punktes gibt an, wie hoch die Verspätung pro Tag insgesamt ist.

So liegt z.B. an einem Tag die Verspätungsquote bei 61%, von diesen Verspätungen lassen sich 11% auf unvorhersehbare Ereignisse zurückführen.

Über alle Tage hinweg beträgt die durchschnittliche Verspätungsquote 49,6%. Der Anteil von Verspätungen aufgrund von nicht vorhersehbaren und nicht von der Bahn beeinflussbaren Ursachen, liegt im Mittel bei 6,7%.

Statistische Ausreißer, also Tage an denen die Abweichungen von diesen Mittelwerten besonders stark ausfallen, werden in der Grafik nicht berücksichtigt.

Legt man nun eine Regressionsgerade durch die Punkte, zeigt sich ein leicht fallender Verlauf.  Das deutet darauf hin, dass der Anteil der Verspätungen, die auf unvorhersehbare Ereignisse zurückzuführen ist, keine Bedeutung für die Gesamtverspätungsquote hat.

Fazit

Die Analyse zeigt, dass eine steigende Zahl von Verspätungen pro Tag, die auf unvorhersehbare und nicht von der Bahn beeinflussbare Ereignisse von außen zurückzuführen ist, nicht zu einer steigenden Verspätungsquote insgesamt führt.

 

Hinterlasse eine Antwort

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *

Du kannst folgende HTML-Tags benutzen: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>