1.2.10 Big Data in der Verkehrsplanung

Datum der Konstituierung: 18.05.2022
Leitung: Dipl.-Ing. Michael Heilig

Problem / Ziel

Digitalisierungsprozesse im Verkehr sowie Fortschritte in der automatisierten Datenverarbeitung produzieren bzw. ermöglichen die Generierung neuer Daten aus alternativen Quellen für Verkehrsplanungsprozesse. Waren bis vor wenigen Jahren nur wenige solche Datenquellen verfügbar (z. B. Floating Car Data), so sind in den letzten Jahren viele neue Datenquellen verfügbar geworden. Diese Massendaten (Big Data) sind dann zumeist flächendeckend und, da automatisiert generiert, vor allem in großen Mengen verfügbar. Sie sind in der Regel zu groß, zu komplex, zu schnelllebig oder zu schwach strukturiert, um sie mit herkömmlichen Methoden der Datenverarbeitung auszuwerten. Im Verkehrsbereich sind in den letzten Jahren insbesondere folgende Big Data zunehmend verfügbar geworden:

OpenStreetMap (OSM)
Landcover Data (z. B. Corrine Land Cover, Urban Atlas)
Daten aus Fahrzeugen oder mobilen Endgeräten (z. B. Floating Car Data)
Mobilfunkdaten (Floating Phone Data)
Daten zu Angebot und Evaluierung von ÖV-Systemen (GTFS-Daten, ITCS-Daten)
Social Network Daten (z. B. Twitter-Posts)
Daten aus Buchungsapps (z. B. angefragte Fahrplanauskünfte, Buchungsanfragen für Sharingangebote)
Angebotsdaten von Mobilitätsanbietern (Daten Mining mittels APIs)
Weitere Daten von Open Data Portalen (z. B. digitale Geländemodelle, Daten von stationären Messtellen zur Luftqualität, Wetterdaten)

Während einige dieser Big Data für die Verkehrsplanung nur kommerziell verfügbar sind (z. B. FCD, FPD, Buchungsdaten kommerzieller Anbieter), sind andere offen zugänglich (z. B. OSM). Die theoretischen Potenziale von Big Data sind vielversprechend und scheinen flächendeckend konsistente Auswertungen zentraler Aspekte in der Verkehrsplanung zu ermöglichen (z. B. O-D-Matrizen, Verkehrszustandsanalysen, Erreichbarkeiten). Die meist unkontrollierte Generierung und die große Anzahl der Datensamples stellen Anwenderinnen und Anwender jedoch hauptsächlich vor zwei Herausforderungen. Erstens ist die Datenqualität hinsichtlich Vollständigkeit und Repräsentativität oft fraglich. Vollständigkeit ist eher bei Big Data, die das Angebot beschreiben (z. B. OSM), relevant. Repräsentativität ist eher bei Nachfragedaten relevant. Dies führt zu unvollständigen Abschätzungen des Angebots oder zu großen Schiefen in der Nachfrage. Zwar gibt es erste Ansätze einer intrinsischen Datenqualitätsbewertung (ohne externe Vergleichsgrundlage, z. B. Tool zur Qualitätsabschätzung auf Basis historischer OSM-Daten: ohsome quality analyst – OQT). Eine extrinsische Datenqualitätsbewertung (auf Basis einer externen Vergleichsgrundlage) ist aufgrund der Aufwände zur Generierung von Vergleichswerten meist nicht oder nur stichprobenhaft möglich. Zweite Herausforderung ist dies die Anwendung der richtigen Methoden für die Auswertung. So wird vor allem kritisiert, dass die Datenauswertung praktisch ausschließlich nach technischen Aspekten erfolgt und dadurch oftmals der technisch einfachste Weg gewählt wird, die Daten auszuwerten. Statistische Grundprinzipien hinsichtlich einer repräsentativen Stichprobe und hinsichtlich der Bewertung der Aussagekraft werden hierbei oft vernachlässigt bzw. sind bei kommerziellen Daten nicht immer nachvollziehbar.

Zwar finden Big Data in Wissenschaft und Forschung bereits Anwendung, in der Verkehrsplanungspraxis sind diese Datenquellen u. a. aus folgenden Gründen noch nicht weit verbreitet:

Das Potenzial für die Planungspraxis ist für viele Daten noch nicht ausreichend erforscht und dadurch nur unzureichend bekannt.
Die Zugangshürden für Big Data sind zum Teil groß. So sind z. B. Mobilfunkdaten sehr teuer und es fehlt oft an Schnittstellen für den einfachen Datenaustausch bzw. an deren Implementierung (z. B. ITCS-Daten aus ÖV-Fahrzeugen).
Insbesondere bei Datenquellen, die auf der Lokalisierung von Individuen basieren, aber auch bei sonstigen Personen-beziehbaren Daten (z. B. Daten aus sozialen Netzwerken oder Buchungsapps), gibt es Vorbehalte und Unklarheiten bezüglich des Datenschutzes.
Für die professionelle Datenverarbeitung sind spezielle Kenntnisse notwendig (Data Science, Geoinformatik), die bei Praxisplanern evtl. nicht vorhanden sind oder nicht sicher angewendet werden können.

Ziel dieses Arbeitskreises soll es daher sein, einen Überblick über die Daten (mit Schwerpunkt auf Datentypen und nicht auf spezifischen Datenanbietern) und deren Potenziale sowie den Stand der Nutzungsmöglichkeiten zu geben sowie Hinweise für die Verkehrsplanungspraxis zu erstellen, um die Potenziale von Big Data auch in der Anwendung voll ausschöpfen zu können.

Nutzende der Hinweise

Typische Nutzende der Hinweise sind Planende, Kommunen, Landkreise, Verkehrsunternehmen und Verkehrsverbünde. Für diese ist ein Überblick verschiedener Massendaten zur Verkehrsplanung nützlich, um diese gezielt einzusetzen und die Potenziale richtig einzuschätzen. So können einmal eventuelle Vorbehalte abgebaut und auch Fehlinterpretationen der Daten vermieden werden. Der Einsatz in der breiten Planungspraxis wird dadurch gefördert und die Potenziale der Daten somit voll ausgeschöpft.

Grobe Gliederung des Inhalts

Einleitung/Begriffsdefinition
Datensammlung
2.1 (Open-) Data-Portale
2.2 Web-Datenbanken
2.3 APIs
Datenhaltung
3.1 Datenschutz
3.2 Datenformate
3.3 Datenbanken
Datenverarbeitung
4.1 Statistische Grundlagen
4.2 Methoden der Qualitätsbewertung
4.3 Effiziente Verarbeitung großer Datenmengen
4.4 Rechtliche Rahmenbedingungen
Anwendungsmöglichkeiten im Verkehrsbereich
5.1 Angebotsdaten (z. B. Netze, POIs, Erreichbarkeiten, …)
5.2 Nachfragedaten (z. B. Quelle-Ziel-Relationen, Verkehrszustände, …)
Weiterer Forschungsbedarf

Angestrebtes Ergebnis

Wissensdokument (Hinweise W 1) – 2024

Menü

1.2.10 Big Data in der Verkehrsplanung

Problem / Ziel

Angestrebtes Ergebnis

Gremienauswahl