"Det er super spændende at se denne metode føre til bedre forudsigelser af morgenpendeltrafik så sent som kl. 5 om morgenen, og jeg tror, at denne hurtigt kan implementeres i mange af vores transportledelsescentre," siger Sean Qian. (Kredit: Shutter Runner / Flickr)
Forskere har brugt information hentet fra tweets for at give enestående nøjagtighed til forudsigelse af morgentrafikmønstre.
Morgenpendlingsperioden er en af de travleste tidspunkter på dagen for trafik; det har imidlertid også vist sig at være det sværeste tidspunkt at forudsige trafikmønstre. Dette skyldes, at de fleste metoder til forudsigelse af trafik er afhængige af at have en jævn strøm af trafikdata fra tiden frem til den forudsagte periode.
Flertallet af mennesker bruger imidlertid tiden forud for deres pendler sove eller udføre deres morgenrutiner derhjemme og efterlade et stort hul i forudsigelige trafikdata.
Forskernes metode løser dette problem ved at hente data fra tweets sendt mellem aftenen før og tidlig morgen den følgende dag. De brugte først Twitters applikationsprogrammeringsgrænseflade (API) til at identificere tweets inden for et givet område (i dette tilfælde byen Pittsburgh) med geotags, der angiver hvorfra de blev sendt. De brugte derefter en anden applikation kaldet Twint, en webskraber, der trak andre indlæg fra brugere med geotaggede tweets for at skabe et bedre billede af de tider og det generelle område, inden for hvilket brugeren var aktiv. Alle data blev anonymiseret og frataget alle personligt identificerbare oplysninger inden offentliggørelse.
"Vi argumenterer for, at tweets indfanger tre typer nyttige oplysninger til forklaring af morgentrafik næste dag, som inkluderer folks søvnvågenstatus, lokale begivenheder og (planlagte) trafikhændelser," forfattere Sean Qian, lektor i civil- og miljøteknik, og Weiran Yao, Qians ph.d.-studerende, skriver.
Yderligere udvidelse af dette datasæt tillod forskerne at udtrække yderligere information. Ved hjælp af sproganalyse identificerede teamet søgeudtryk, der kunne indikere en trafikhændelse. Dette inkluderer ikke kun ulykker, men også planlagte lukninger eller store begivenheder som en koncert, et sportsspil eller en festfest.
Enkle personlige tweets som "Havde en eksplosion på Pirates-spillet!" eller "Denne fenderbender foran vil gøre mig sent", kan faktisk give vigtig information, især når den er tagget med en geotag eller informeret af andre tweets fra den bruger. Yderligere data blev også hentet fra officielle konti, såsom nyhedsudsendelser og lokale myndigheder, som ofte tweeter direkte rapporter om ulykker og planlagte lukninger.
Når de kombineres, giver disse metoder et stort datasæt af oplysninger, der antydede den geografiske fordeling og sandsynlige søvn / vågetid pendlere, såvel som planlagte og utilsigtede trafikhændelser, der kan påvirke deres pendling. Dette broede informationsgabet, der blev skabt af lullet i natten i trafikken.
Med disse oplysninger var Qian og Yao i stand til at give trafikforudsigelser for Pittsburghs morgenpendlingsperiode med tidligere uset nøjagtighed og har skabt en omfattende ramme til forudsigelse af morgentrafikforhold i byer områder.
Få det nyeste via e-mail
Denne information giver dem også mulighed for at begynde at foretage observationer og forudsigelser på en større, daglig daglig skala. Dette inkluderer at finde ud af, at Pittsburghs morgentrafik generelt var mere overbelastet tirsdage, onsdage og torsdage, hvilket kunne sætte transportbureauer i stand til bedre at styre morgenpendlen. Denne form for observationer - tidligere umulige på grund af manglende evne til nøjagtigt at forudsige morgenforhold - kan informere større beslutninger inden for styring af rejsefterspørgsel, styring af signal timing og personlig ruting af destination.
"Denne forskning udnytter maskinindlæring og big data til at forstå menneskelig adfærd og samtidig bevare individets privatliv," siger Qian.
"Det er super spændende at se denne metode føre til bedre forudsigelser af morgenpendeltrafik så sent som kl. 5 om morgenen, og jeg tror, at dette hurtigt kan implementeres i mange af vores transportledelsescentre."
Om forfatterne
Deres resultater vises i Transportforskning. - Original Study