Wie die Verkehrsprognose in Oberösterreich funktioniert

Wissen, wo Staus sein werden, bevor Sie losfahren

von DI Dr. Károly Bósa

Haben Sie sich jemals gewünscht, den Verkehr vorhersehen zu können, bevor Sie Ihr Haus verlassen? In Oberösterreich wird dies durch innovative Technologien möglich gemacht. Das Echtzeit-Verkehrssystem des Landes OÖ bietet verlässliche Vorhersagen für die kommende Stunde – und das jeden Tag, ob Werktag oder Feiertag. Doch wie funktioniert das?

Verkehr in Echtzeit verstehen: Oberösterreichs Weg zur Technologieunabhängigkeit
Spezielle Anforderungen der oberösterreichischen Echtzeitverkehrsprognose
Auswahl von ARIMA als geeignetes Prognoseverfahren
Einbindung der Vorhersage in das Gesamtsystem
Qualitätsmetriken der Vorhersage
Appendix I: Interne Validierung I: Fehler in km/h
Appendix II: Interne Validierung II: Root Mean Squared Error (RMSE)
Referenzen
Autor
Weiterlesen

Verkehr in Echtzeit verstehen: Oberösterreichs Weg zur Technologieunabhängigkeit

Informationen über die aktuelle Verkehrslage sind von grundlegender Wichtigkeit für private Verkehrsteilnehmer*innen genauso wie für die Routenplanung von Logistikunternehmen. Privatpersonen beziehen diese Informationen meist von großen US-amerikanischen Dienstleitern wie Google. Um hierbei in keine technologische Abhängigkeit von diesen Dienstleistern zu geraten und die Technologiesouveränität Österreichs zu stärken, baute die RISC Software GmbH im Rahmen des Projekts ITS Upper Austria ein Echtzeitverkehrslagebild für Oberösterreich auf, welches auch im Rahmen des österreichweiten Projekts EVIS.AT eingesetzt wird.

Ein technologisches Kernelement ist hierbei die Prognose der Verkehrslage auf dem oberösterreichischen Straßennetz, die dabei auf in Echtzeit gesammelten und anonymisierten Verkehrsdaten von Flotten-Fahrzeugen (beispielsweise der Dienstfahrzeuge des Landes Oberösterreich, des ÖAMTC oder des oberösterreichischen Verkehrsverbundes), sowie Daten aus stationären Verkehrszählern (Seitenradare, Induktionsschleifen) und Bluetooth-Sensoren basieren.

Die von der RISC Software bereitgestellten Verkehrsprognosen für Oberösterreich können z.B. auch im ASFINAG Routenplaner abgerufen werden, die dafür notwendigen Schritte sind in Abbildung 1 dargestellt.

Abbildung 1: Die Vehrkehrsprognose für OÖ im Asfinag Routenplaner

Kurzfristige Verkehrsprognosen werden durch die Schätzung der erwarteten Verkehrsbedingungen in der nahen Zukunft anhand historischer und aktueller Verkehrsinformationen durchgeführt. Diese beziehen sich auf einen Zeitraum von bis zu eineinhalb Stunden in die Zukunft.

Ein wesentliches Charakteristikum der kurzzeitigen Verkehrsvorhersage ist, dass sie schnell auf aktuelle Ereignisse wie Staus oder Baustellen reagieren muss. Die hier beschriebene Prognose erreicht dies unter anderem durch die effiziente Einbindung der aktuellen Fahrzeugdaten der Verkehrsflotten.

Spezielle Anforderungen der oberösterreichischen Echtzeitverkehrsprognose

Obwohl die Verkehrsprognoselösung der RISC Software GmbH mit Autoregressive Integrated Moving Average (ARIMA) einen der bereits in der Literatur vorhandenen Ansätze anwendet, ist sie dennoch einzigartig. Dies liegt vor allem darin begründet, das sie als produktiver Dienst mindestens zwischen 5 und 23 Uhr an allen 365 Tagen des Jahres kurzfristige Verkehrsprognosen für das Straßennetz von Oberösterreich liefern muss. Damit muss auch die zugrundeliegende Serverinfrastruktur auf einen verlässlichen Dauerbetrieb ausgelegt sein, was vor allem eine redundante Auslegung der Serverinsfrastruktur und der Softwareinstallation erfordert.

Im Kern handelt es sich um eine Massenvorhersagelösung, die kurzfristige Verkehrsprognosen für etwa 100.000 Straßenabschnitte in Oberösterreich berechnen muss. Damit ist auch die Leistungsfähigkeit der zugrundenliegenden Berechnungen sowie der Datenbankabfragen für einen effektiven Betrieb des Systems essentiell, da für jeden dieser Straßenabschnitte das System alle 15 Minuten fünf Vorhersagen für jeweils 15, 30, 45, 60 und 75 Minuten in der Zukunft liefern muss.

Die tatsächliche Anzahl der gemeldeten Vorhersagen schwankt und hängt stark von der Menge der verfügbaren Eingabedaten ab. Diese hängt wiederum direkt von der Anzahl der Flottenfahrzeuge sowie der weiteren Sensoren ab, welche im fraglichen Abschnitt und Zeitbereich Daten geliefert haben. Beispielsweise variierte die Anzahl der Straßenabschnitte, für die der Dienst wirklich kurzfristige Vorhersagen liefert, im Februar 2024 zu Stoßzeiten zwischen 65.000 und 80.000. Wenn für einen Straßenabschitt keine genaueren aktuellen Daten verfügbar sind, werden die entsprechenden Werte der täglichen mittleren Geschwindigkeiten für die Prognose herangezogen.

Als zusätzliche Herausforderung unterliegt der Verkehr unterschiedlichen saisonalen und zeitlichen Mustern. Es unterscheidet sich der tägliche Verkehr an vielen Wochentagen, in Schul- und Ferienzeiten sowie an nationalen Feiertagen. Damit muss jeweils die passende historische Gechwindigkeitwerte für die Berechnung von der Verkehrsprognose für den aktuellen viertelstündlichen Intervall verwendet werden. Aufgrund der oben genannten komplexen saisonalen Anforderungen wird täglich eine Vorberechnung durchgeführt, welche auf den für diesen Tag relevanten historischen Daten basiert. Diese dient als Basis für eine möglichst gute Berücksichtiguung der saisonalen Effekte bei der Berechnung der viertelstündlichen Vorhersagen.

Auswahl von ARIMA als geeignetes Prognoseverfahren

Generell ist die Erstellung von Vorhersagen basierend auf vergangenen und aktuellen Messdaten ein seit über einem Jahrzehnt gut erforschtes Gebiet des maschinellen Lernens, für das häufig Ansätze basierend auf Zeitreihendaten verwendet werden. Es wurden bereits eine Vielzahl von Vorhersagemethoden entwickelt, um Aufgaben dieses Problemfeldes zu lösen, wie zum Beispiel das Auto-Regressive Integrated Moving Average (ARIMA), Support Vector Regression (SVR), Grey System Model, k-Nearest-Neighbor und Neuronale Netzwerke, von denen Long Short-Term Memory (LSTM) einen Speziallfall darstellt.

Die Größe des Problems und die Rechenkomplexität der für die einzelnen Algorithmen benötigten Vorberechnungsphasen begrenzen jedoch die Auswahl. In einer Machbarkeitsstudie vor der Integration in den Prognoseservice wurden daher verschiedene Leistungsfaktoren der oben genannten Vorhersagemethoden anhand eines kleinen Stichproben-Datensatzes verglichen.

Die Ergebnisse zeigten, dass Long Short-Term Memory (LSTM) die niedrigste Fehlerquote aufwies und somit etwas bessere Ergebnisse als ARIMA liefert. Jedoch würde das Training eines solchen Modells nach der Hochrechnung jeden Tag mehrere Stunden in Anspruch nehmen, was die für diesen Dienst vorgesehenen Hardware-Ressourcen stark beanspruchen würde. Ohne zusätzliche Hardware könnte dies zu Problemen führen, da das System bis zu den Stoßzeiten im Morgenverkehr nicht in der Lage wäre Prognosewerte zu liefern. Daher wurde die ARIMA-Methode gewählt, für die produktives System die erforderlichen Zeitreihen in etwas mehr als einer halben Stunde vorbereiten kann. In der Praxis bedeutet dies, dass die Software die Vorberechungen für die täglichen Prognosen spätestens 40 Minuten nach Mitternacht abschließen kann.

Vor der Entwicklung des Massenvorhersage-Service wurden einen Prototyp der Prognoselogic in eine GUI-basierte Software der RISC Software GmbH, genannt Traffic Evaluation and Sensor Statistics (TESS) integriert. In dem sog. Prognose-Modul dieser Anwendung kann ein einzelner Straßenabschnitt auf der Karte von Oberösterreich ausgewählt und eine Verkehrsprognose für diesen Abschnitt berechnet werden. Die Hauptidee hinter der Entwicklung von diesem TESS-Modul bestand unter anderem darin, alle geplanten Methoden und Algorithmen gemeinsam zu testen und zu optimieren. In dem Prognose-Modul von TESS ist es außerdem möglich die Abweichungen zwischen den Vorhersagen und dem tatsächlichen Verkehrsfluss für eine beliebige Uhrzeit innerhalb der letzten zwei Tage zu visualisieren. Die finalisierte Prognose-Logik in diesem Modul wird nun als Kern des produktiven Systems eingesetzt.

Abbildung 2: Prognose-Modul in TESS

Einbindung der Vorhersage in das Gesamtsystem

Um die obengenannten Anforderungen zu erfüllen und die Prognosen zeitgerecht ausliefern zu können, werden die Eingabedaten über einen optimierten Citus PostgreSQL-Cluster zur Verfügung gestellt, der von der RISC Software GmbH gehostet wird.

Diese Daten umfassen unter anderem das aktuelle Straßennetz von Oberösterreich, welches auf den Daten der Graph Integration Platform (GIP.AT) basiert. Weiters werden die gemittelten Geschwindigkeiten – sogenannte Ganglinien – basierend auf Verkehrsdaten der letzten Wochen, die in 15-Minuten-Intervallen aggregiert wurden, bereitgestellt. Zusätzlich werden die aktuellen Echtzeit-Verkehrssensordaten in der Datenbank gespeichert.

Für die Berechnung einer aktuellen Prognose wird immer nur die Teilmenge der Ganglinien geladen, die dem saisonalen Typ des aktuellen Tages entspricht. Innerhalb der Prognose werden die Ganglinien für den aktuellen Tag verwendet, um die Kontinuität unvollständiger Zeitreihen wiederherzustellen, indem eine Glättungstechnik verwendet wird. Hierbei werden aber auch aktuelle Verkehrstrends berücksichtigt. Zusätzlich werden die Daten der Ganglinien herangezogen, wenn für eine Prognose nicht genügend aktuelle Messdaten für eine aktuelle, kurzfristige Vorhersage verfügbar sind.

Alle 15 Minuten gibt der Dienst Vorhersagen für die durchschnittlichen Geschwindigkeitswerte 15, 30, 45, 60 und 75 Minuten im Voraus für jeden Hauptstraßenabschnitt in Oberösterreich aus. Wie oben erwähnt, hängt die Anzahl der Vorhersageberechnungen in jedem 15-Minuten-Zeitintervall stark von der Menge der verfügbaren Echtzeit- und historischen Verkehrsdaten ab. EVIS.AT erfordert jedoch, dass der Prognosedienst eine Schätzung der Verkehrssituation in naher Zukunft auf allen vordefinierten Straßenabschnitten bereitstellt.

Daher gibt die Anwendung dennoch eine Schätzung für die Verkehrssituation ab, wenn eine Zeitreihenprognose für eine Straße aufgrund bestimmter fehlender Verkehrsinformationen nicht möglich ist. Diese kann je nach Datenverfügbarkeit mehrere Stufen der Genauigkeit durchlaufen:

Wenn bereits eine zuvor berechnete kurzfristige Prognose vorhanden sind, wird diese Schätzung erneut als Vorhersage für denselben Zeitstempel veröffentlicht (z. B.: Wenn die Vorhersageberechnung nicht mehr möglich ist und das System vor 45 Minuten einen Geschwindigkeitswert für 60 Minuten im Voraus vorhergesagt hat, wird dieser Wert erneut als 15-Minuten-Vorhersage veröffentlicht). Wenn keine älteren Vorhersagen verfügbar sind, werden stattdessen die entsprechenden durchschnittlichen Geschwindigkeitswerte basierend auf historischen Daten der letzten Wochen verwendet. Wenn auch diese für einen bestimmten Straßenabschnitt nicht verfügbar sind, werden die entsprechenden Werte der täglichen Ganglinien als Vorhersage veröffentlicht.

Abbildung 3: Screenshots zu den Logs des Prognoseservices (links) und dem Performance-Monitor des Servers (rechts), der die Auslastung der CPUs anzeigt.

Obwohl der in Produktion befindliche Dienst aktuell kontinuierlich 14 von 16 CPUs des Servers, auf dem die Anwendung gehostet wird, auslastet und die Rechenleistung nutzt (siehe rechte Seite von obiger Abbildung), beeinträchtigt dies nicht die Leistungsfähigkeit der Software. Falls in naher Zukunft mehr Rechenleistung benötigt wird (z. B. aufgrund einer signifikanten Zunahme der Verkehrssensorenabdeckung im oberösterreichischen Straßennetz), kann der Prognosedienst problemlos auf einer Maschine mit mehr CPUs neu bereitgestellt werden, um die Leistung zu skalieren. Die Software erkennt automatisch Änderungen in der Anzahl der verfügbaren Rechenressourcen und verteilt die Berechnungsaufgaben automatisch auf diese Ressourcen um.

Qualitätsmetriken der Vorhersage

Der Prognosedienst ist mit einem Mechanismus ausgestattet, der kontinuierlich 15- und 30-Minuten-Vorhersagewerte zwischenspeichert, solange er sie mit den gemessenen Echtzeit-Verkehrsdaten vergleichen kann, und berechnet den durchschnittlichen täglichen Unterschied zwischen ihnen für jede Hauptverkehrswege. Diese Selbstvalidierung wird nur für die neu berechneten, aktuellen, kurzfristigen Vorhersagen angewendet, nicht für andere veröffentlichte Werte (also nicht für erneut veröffentlichte frühere Vorhersagen oder tägliche Kurvenwerte).

Anhang I und Anhang II fassen kurz eine vorläufige Analyse der Validierungsdaten der 30-Minuten-Vorhersagewerte zusammen, die im Oktober 2019 gesammelt wurden. Anhang I fasst die durchschnittlichen täglichen Abweichungen zwischen der Vorhersage und den gemessenen Verkehrsdaten in km/h zusammen, während Anhang II dasselbe in Bezug auf den Root Mean Squared Error (RMSE) tut. Die Analyse dieser Daten zeigt, dass bei etwa 93% der Straßenabschnitte die durchschnittliche tägliche Abweichung weniger als 5 km/h beträgt und dass bei etwa 56% der Straßenabschnitte der RMSE weniger als 3 beträgt.

Appendix I: Interne Validierung I: Fehler in km/h

Dies ist eine Zusammenfassung der mittleren täglichen Abweichungen in km/h zwischen den 30-Minuten Vorhersagen und den gemessenen Geschwingkeitswerten vom Oktober 2019:

Im Fall von 243 Straßenabschnitten betrug die Abweichung zwischen 15 und 37 km/h.
Im Fall von 964 Straßenabschnitten betrug die Abweichung zwischen 10 und 15 km/h.
Im Fall von 8923 Straßenabschnitten betrug die Abweichung zwischen 5 und 10 km/h.
Im Fall von 74926 Straßenabschnitten betrug die Abweichung zwischen 1 und 5 km/h.
Im Fall von 61781 Straßenabschnitten betrug die Abweichung weniger als 1 km/h.

Zusammenfassung: Im Fall von etwa 93% der Straßenabschnitte beträgt die durchschnittliche Abweichung weniger als 5 km/h.

Appendix II: Interne Validierung II: Root Mean Squared Error (RMSE)

Dies ist eine Zusammenfassung der mittleren täglichen Abweichungen des RMSE zwischen den 30-Minuten Vorhersagen und den gemessenen Geschwingkeitswerten vom Oktober 2019:

Im Fall von 112 Straßenabschnitten lag der RMSE über 20.
Im Fall von 2605 Straßenabschnitten lag der RMSE zwischen 10 und 20.
Im Fall von 62048 Straßenabschnitten lag der RMSE zwischen 3 und 10.
Im Fall von 67432 Straßenabschnitten lag der RMSE zwischen 1 und 3.
Im Fall von 14640 Straßenabschnitten lag der RMSE unter 1.

Zusammenfassung: Im Fall von etwa 56% der Straßenabschnitte betrug der RMSE weniger als 3.

Referenzen

Cao, L. J. & Tay, F. E. H. (2003) Support vector machine with adaptive parameters in financial time series forecasting. Neural Networks, IEEE Transactions on, 14 (6), 1506-1518.
GIP, An Intermodal Traffic Graph Austria, 2021, https://www.gip.gv.at/assets/downloads/GIP_Standardbeschreibung_2.3.2_FINAL.pdf
Kim, K. J. (2003) Financial time series forecasting using support vector machines. Neurocomputing, 55 (1-2), 307-319.
Lu, C. J., Lee, T. S. & Chiu, C. C. (2009) Financial time series forecasting using independent component analysis and support vector regression. Decision Support Systems, 47 (2), 115-125.
Majhi, R., Panda, G. & Sahoo, G. (2009) Efficient prediction of exchange rates with low complexity artificial neural network models. Expert Systems with Applications, 36 (1), 181-189.
Pai, P. F. & Lin, C. S. (2005) A hybrid ARIMA and support vector machines model in stock price forecasting. Omega, 33 (6), 497-505.
Saad, E. W., Prokhorov, D. V. & Wunsch, D. C. (1998) Comparative study of stock trend prediction using time delay, recurrent and probabilistic neural networks. IEEE Transactions on Neural Networks, 9 (6), 1456-1470.
Sharma, S. K. & Sharma, V. (2012) Time series prediction using kNN algorithms via euclidian distance function: a case of foreign exchange rate prediction. Asian Journal of Computer Science and Information Technology, 2 (7), 219-221.
Wang, Y. F. (2002) Predicting stock price using fuzzy grey prediction system. Expert Systems with Applications, 22 (1), 33-38.