Voorspelmodellen voor toeristische druk
De buienradar voor toerisme komt er aan
Een monitor om bezoekersdrukte te meten is mooi, maar veel steden en regio’s willen weten wat de verwachte drukte wordt. Hoe pak je dat aan? Harm IJben en Jasper Heslinga van kenniscentrum Centre of Expertise Leisure, Tourism and Hospitality (CELTH) gingen op zoek naar antwoorden.
Op driekwart van het interview valt het begrip ‘buienradar voor het toerisme’ en dat tovert twee lachen op het beeldscherm bij het online interview. Harm IJben (programmamanager en onderzoeker bij HZ University of Applied Sciences) en Jasper Heslinga (docent en onderzoeker bij NHL Stenden en programmaleider bij DataFryslân) leveren een literatuurstudie op over voorspelmodellen voor recreatie en toerisme en zij experimenteerden ook met diverse grote datasets. Dat zou wat zijn als je toch voor een bepaalde periode vooruit kunt kijken hoeveel bezoekers naar jouw stad of streek komen? Beleidsmakers, DMO’s maar ook ondernemers staan er om te springen. De waarheid is, zover is het nog niet maar dat beeld klopt wel op de deur van de mogelijkheden. CELTH en Nederlands Bureau voor Toerisme & Congressen (NBTC) financierden het onderzoek. De opdracht is gedaan voor het Data Development Lab Bestemming Nederland (DDL) en levert grote stappen op waarop anderen kunnen bouwen. Dit is niet een op zichzelf staand onderzoek als oefening. CBS en NBTC (samen met CELTH de oprichters van DDL) zijn betrokken om dit initiatief door te trekken. Het ging met vallen en opstaan. De onderzoekers hadden ook wel in de gaten dat er meer nodig was dan alleen theoretische achtergrond. Er kwam een literatuurstudie, diverse experimenten en een expertsessie.
Met Zeeuwse en Friese data uit onder meer 2019 gingen de twee aan de slag om ook echt waarde te leveren voor de doorontwikkeling. Jasper Heslinga: "Het is een eerste experiment en dat is nu afgerond. We starten aan de rapportage en die willen we graag breed delen. Het idee van mij en Harm begon in september van 2020. Samen zagen we de opkomst van de monitors voor toerisme. Dat is een goede ontwikkeling maar dat is wel een vorm van backcasting en juist leeft in de sector de wens om ook vooruit te kunnen kijken. Je wilt als regio, stad of ondernemer anticiperen op de druk die gaat komen en dan maatregelen nemen. Het bleek een mooie wens maar het daadwerkelijk doen was nog een tweede grote stap. In het begin hebben we veel onderzocht wat er nu mogelijk is in de wereld van data science. Dat hebben we naast bestaande voorspelmodellen gelegd. Wat het echt lastig maakte is dat de bruikbare data niet altijd voorhanden waren. Voorspelmodellen hebben een enorme ontwikkeling doorgemaakt. Als je kiest voor een model moet je het ook voeden met data. Nu is er een wereld aan nieuwe data beschikbaar. Denk hierbij aan reviews, gps-techniek toepassen maar ook wat wij hebben gedaan, (web)scraping van bezetting bij accommodaties in de tijd. De modellen worden steeds geavanceerder en wij keken naar de kruisbestuiving tussen data science en toerisme.”
Harm IJben: "De uitkomsten bieden voldoende houvast voor de ontwikkeling van een model.”
20 werkbare methoden
Geen data, geen goed werkend model. Jasper zit bovenop de data omdat hij programmaleider Toerisme en Recreatie is van DataFryslân. De twee inventieve onderzoekers waren al snel op zoek naar goede datasets. De literatuurstudie leverde op dat je met meer verschillende bronnen van data een beter model kan bouwen. Voor iedereen die geïnspireerd raakt en ook wil meedoen, volgt een mooie kanttekening: "Een complexer model is niet altijd een beter model voor toerisme, merken we in ons experiment,” meldt Harm en Jasper knikt instemmend. In Zeeland zijn in eerste instantie GPS-datasets gebruikt om modellen te voeden. Deze GPS-datasets zijn in eerdere jaren (2017, 2019, 2020) met toestemming van gebruikers verzameld via de VVV-Zeelandapp middels geïntegreerde trackingsoftware. In tweede instantie zijn weerdata (KNMI) en informatie over evenementen van de evenementenkalender toegevoegd. In Friesland werd scraping van het Airbnb aanbod, ratings en bezetting toegepast. Daar valt nog veel op af te dingen maar de twee lijken verrast over de eerste resultaten. Een model om drukte te voorspellen zit er echt in voor de sector. Harm: "De uitkomsten bieden voldoende houvast voor de ontwikkeling van een model.” Harm en Jasper willen daarin graag het beeld ombuigen dat een literatuurstudie maar een bijproduct is. "Een literatuurstudie levert op dat je de eerste stappen zet want anders blijf je er maar over praten. Voorspelmodellen worden al een tijd gebruikt, maar de toepassing op toerisme is nog beperkt. We kwamen tot een serie van liefst twintig typen methodes die mogelijk voor toerisme werken. Dat overzicht was er nog niet. Nu kunnen we met de sector de match maken tussen niveau van complexiteit en de keuze van de databronnen. Een literatuurstudie is daarin je reddingsboei. Daarna konden we experimenteren. De beschikbare datasets bleken niet geschikt om een goed model gebaseerd op tijdsreeksen te voeden. Een model gebaseerd op lineaire regressie gaf een veel beter beeld.”
"Je wilt als regio, stad of ondernemer anticiperen op de druk die gaat komen en dan maatregelen nemen."
De literatuurstudie en de eerste experimenten zijn gemaakt binnen de samenwerking van CELTH en het Data Development Lab (DDL). Scraping van de Friese data in het aanbod leverde al snel opvallend goede uitkomsten op en de data scientists van DataFryslân werken nu verder aan een uitgebreider voorspelmodel. In Zeeland ging het ook goed, GPS-data van geregistreerde verplaatsingen werd gecombineerd met andere bronnen om de drukte te voorspellen op een bepaalde dag in het jaar. Tot verrassing van HZ Kenniscentrum Kusttoerisme bleken de uitkomsten behoorlijk accuraat. "Ze waren verbaasd dat we zover konden komen. Nu is het overgedragen aan het HZ lectoraat Data Science omdat het DDL experiment is afgelopen, maar zij bekijken of het nog wat scherper kan in de toepassing van de data. Er is online onder meer nog veel meer te vinden over weerdata. De basis met de gps-aanpak bleek goed mogelijk en dat is winst.”
Warm gevoel voor data?
De literatuurstudie en de ervaringen met de eerste modellen zijn gedeeld met het Data Development Lab (DDL). Het lab is een samenwerking van NBTC, CBS en diverse steden en regio’s. Het leverde meteen discussie op hoe ver vooruit je kunt kijken. Amsterdam toonde meteen interesse omdat in de stad veel onderzoek is gedaan onder bezoekers. Die data kunnen leiden tot een verbetering in de voorspelling voor de hoofdstad. "Ondanks veel data over weer en reeksen met bewegingen uit het verleden kun je niet twee weken vooruit voorspellen,” vertellen de twee onderzoekers. Dat is niet zo raar, ook weersvoorspellingen hebben al moeite met meerdere dagen en dat zal bij toerisme niet makkelijker worden. Nu is het aan anderen om met de ervaringen tot concrete modellen te komen. De twee onderzoekers realiseren zich dat niemand in de sector een data scientist is. Harm: "Het helpt wel als je gevoel hebt voor data en wat je er mee kan. Misschien hebben steden en regio’s goede connecties met het bedrijfsleven en de wetenschap waardoor je data scientists kunt betrekken.” Gaandeweg het interview komt ook om de hoek dat je als maker van een model goed moet vaststellen waar je naar kijkt. Dat wordt ook beïnvloedt door hoe de bewoner en de bezoeker kijken naar drukte. De ontwikkeling van een model past in de discussie over overtoerisme en bezoekersmanagement. De meningen over ervaren drukte lopen fors uiteen. Harm: "In Domburg is het in de zomer relatief net zo druk als in Veere maar in Veere vinden de bewoners dat veel vervelender. Hoe mensen toerisme ervaren heeft met veel meer te maken dan alleen het vaststellen hoe druk het is of wordt. Misschien moet een voorspellingsmodel ook daar een waarde aan hangen.”