
Open datasets helpen bij het simuleren van wereldwijde waterproblemen
Een nieuwe publicatie op 4TU.ResearchData helpt het risico op overstromingen in te schatten als gevolg van klimaatverandering
Al sinds 2011 werken de onderzoekers van de faculteit Geowetenschappen van de Universiteit Utrecht aan een wereldwijd hydrologisch model. Het model monitort de weg die neerslag aflegt over de aarde. Met dit Water Balance Model (PCR-GLOBWB) wordt het mogelijk om een druppel neerslag te volgen, vanaf het moment dat het neervalt totdat het de zee bereikt. Het model, dat gemaakt wordt door onderzoekers op de afdeling Fysieke Geografie, is gebaseerd op data over 120 jaar. Daaraan werken meer dan 18 mensen, die zeer nauw met elkaar samenwerken. Juist deze goede samenwerking heeft geleid tot de gedetailleerde versie die het nu is (Sutanudjaja et al. 2018). Het wordt het veel gebruikt door overheden, NGO's, onderzoekers en beleidsmakers. Zij doen simulaties om in kaart te brengen wat de impact is van regenval (of juist het gebrek daaraan).
In dit artikel gaan we dieper in op dit baanbrekende initiatief. We interviewen assistent-professor Niko Wanders, die behoort tot het ontwikkelteam, en Edwin Sutanudjaja, een van de ontwikkelaars van het model en het eerste aanspreekpunt voor gebruikers. Samen met professor Marc Bierkens en assistent-professor Rens van Beek coördineren zij de ontwikkelingen van het PCR-GLOBWB. De bijbehorende dataset, in NetCDF formaat, kan kostenloos worden gebruikt op de 4TU.ResearchData OPeNDAP server. We vroegen Niko en Edwin naar hun ervaringen en hoe zij ervoor zorgen dat de dataset FAIR is.
De impact van het onderzoek
Het Water Balance Model (PCR-GLOBWB) heeft veel invloed op beleidsmakers, voorspellingen over het klimaat en natuurlijk ook op andere onderzoekers. De Nederlandse regering, het World Research Institute en de Europese Commissie zijn maar een paar voorbeelden van organisaties die profiteren van de voorspellingen en de simulaties van het PCR-GLOBWB-team.
Het model kan bijvoorbeeld voorspellen wat de impact is van overstromingen wanneer de temperatuur met twee of drie graden zou stijgen. De voorspellingen kunnen worden gedaan op basis van vele variabelen, zoals temperatuur, evaporatie, hoogteverschillen en vochtigheid van de grond. Sinds kort kunnen er ook variabelen worden meegenomen die worden veroorzaakt door menselijk handelen, zoals aangelegde reservoirs, irrigatie en water dat wordt opgeslokt door vee.
Niko benadrukt dat het projectteam erg hard werkt om de dataset te onderhouden. Zonder deze dataset kan het model natuurlijk niet worden gebruikt.
'De dataset is echt het resultaat van een geweldige samenwerking. Er zijn veel onderzoekers, soms ook van andere universiteiten, die aan het project bijdragen. We organiseren maandelijkse meetings waarin we afspraken maken en recente ontwikkelingen bespreken. Dat gaat dan bijvoorbeeld over het toevoegen van nieuwe variabelen of over de fondsen waarvoor we ons willen aanmelden. Juist de gedetailleerdheid van de dataset zorgt ervoor dat er hele specifieke en lokale vragen beantwoord kunnen worden'.
Wereldwijd hebben onderzoekers data aangeleverd die zijn opgenomen in de dataset. Niko legt uit: 'We ontvangen data van over de hele wereld en die voegen we allemaal samen. Dit geeft een uniek beeld van hoe regen zich door de aarde beweegt totdat het uiteindelijk in de zee terechtkomt. De dataset houdt echt elke locatie in de wereld bij. Dit is ook de grootste reden dat andere instellingen, zoals overheden, onze gegevens zo graag gebruiken'.
Edwin voegt toe: 'Met de data kunnen we maandelijkse voorspellingen maken die in kaart brengen hoe het water zich in de komende zes maanden zal voortbewegen. Dit helpt om toekomstige problemen te voorspellen, zoals mislukte oogsten of energieproblemen. Doordat deze voorspellingen zo nuttig zijn, hebben we de resolutie van het model zeer recent ook nog verhoogd, van 50 kilometer naar 10 kilometer nauwkeurigheid. Nu kunnen we echt zeer detaillistisch voorspellingen doen en antwoorden geven op hele specifieke vragen'.
NetCDF data & OPeNDAP
De complete dataset heeft een grootte van meer dan 14TB, in verschillende formats. Een groot deel daarvan heeft het NetCDF-formaat (Network Common Data Form), dat veel wordt gebruikt in de klimatologie. NetCDF is een zelf-beschrijvend, machine-onafhankelijk dataformaat dat de creatie, de toegankelijkheid en het delen van matrix-georiënteerde data makkelijker maakt. Doordat het een open format is, kan het ook makkelijk worden gebruikt met verschillende software.
Wanneer onderzoekers geïnteresseerd zijn in de onderliggende data van het Global Water Balance model, nemen ze contact op met Edwin. Het verstrekken van die data is lastig. Het is namelijk onmogelijk om de data via e-mail te verzenden. Downloaden is ook geen optie, omdat er dan wel heel veel opslagcapaciteit op de computer nodig is. De OPeNDAP server, aangeboden door 4TU.ResearchData, is de perfecte oplossing. OPenDAP maakt het mogelijk om de data eerst in te zien en te verkennen. Zo hoeft de onderzoekers alleen die delen te downloaden die voor een bepaald doel relevant zijn.
OPeNDAP zorgt voor nieuwe mogelijkheden
Niko benadrukt de waarde van de OPeNDAP server: 'OpeNDAP is toegankelijk, flexibel en het is erg makkelijk om specifieke informatie op te vragen. Dit maakt hele gedetailleerde simulaties mogelijk'. Op dit moment hebben Niko en Edwin rond de 250 GB van de dataset op de OPeNDAP-server geplaatst en er zal snel meer volgen.
Het openbaar maken van de NetCDF-data op de OPeNDAP server van 4TU.ResearchData heeft nog meer voordelen.
Niko vertelt: 'Het gemakkelijk delen van de dataset met andere onderzoekers is cruciaal om de impact van het project te vergroten. Door ons model te delen, kan er door anderen met onze data worden gewerkt en kan er nieuwe kennis worden vergaard. De mogelijkheid om de data eerst in te zien, alvorens het te downloaden, zorgt er ook voor dat er een nieuwe groep van gebruikers ontstaat. Zij kunnen nu antwoorden vinden op regionale en lokale vragen, bijvoorbeeld toegespitst op ontwikkelingslanden'.
Edwin gaat verder: 'Er is veel interesse in onze data en daarom werk ik nu aan een uitgebreide handleiding. Het is goed om de onderzoekers te laten weten hoe ze de data het best kunnen gebruiken en hoe ze moeten navigeren door de overweldigende hoeveelheid aan data die we aanbieden'.
Het gebruik van interactieve kaarten
Ondanks het succes van het model en de data, benoemt Niko ook een aantal uitdagingen. 'Het maken van modellen is niet heel sexy, dus het is lastig om geld van fondsen binnen te halen. En als we het geld ervoor hadden, zou ik de data ontzettend graag visueel willen maken. Dat zou echt geweldig zijn! Goed gevisualiseerde klimaatdata, in de vorm van interactieve kaarten, wordt namelijk het meest gebruikt voor analyses, omdat het dan minder tijd kost om de data te interpreteren. De interactieve kaarten zouden veel bijdragen aan de gebruiksvriendelijkheid en het vergroten van de impact van de dataset. En dat is uiteindelijk waar we het allemaal voor doen: het bieden van antwoorden op hydrologische problemen over de hele wereld!'
Dit interview is een samenwerking tussen 4TU.ResearchData en RDM Support van de Universiteit Utrecht.
Auteur: Daen Smits, Trainee Research Data Officer, 4TU.Centre for Research Data | TU Delft Library
Referenties
Sutanudjaja, E. H., van Beek, R., Wanders, N., Wada, Y., Bosmans, J. H. C., Drost, N., van der Ent, R. J., de Graaf, I. E. M., Hoch, J. M., de Jong, K., Karssenberg, D., López López, P., Peßenteiner, S., Schmitz, O., Straatsma, M. W., Vannametee, E., Wisser, D., and Bierkens, M. F. P. (2018). PCR-GLOBWB2: A 5 arcmin global hydrological and water resources model. Geosci. Model Dev., 11, 2429-2453. DOI:10.5194/gmd-11-2429-2018
Link naar de dataset: https://doi.org/10.4121/uuid:e3ead32c-0c7d-4762-a781-744dbdd9a94b