Advertentie
digitaal / Nieuws

Gebrek aan standaarden voor open data bij gemeenten

Er zijn standaarden nodig voor het aanleveren van open data door gemeenten. Dat is een van de conclusies die Jesse Hablé van de TU Delft trekt in zijn masterscriptie (pdf), die hij schreef bij Open State Foundation. Organisaties die open data verwerken, hebben een zware dobber aan alle verschillende formaten waarin gemeenten hun informatie aanleveren.

15 oktober 2019
open-standaard.jpg

Er zijn standaarden nodig voor het aanleveren van open data door gemeenten. Dat is een van de conclusies die Jesse Hablé van de TU Delft trekt in zijn masterscriptie (pdf), die hij schreef bij Open State Foundation. Organisaties die open data verwerken, hebben een zware dobber aan alle verschillende formaten waarin gemeenten hun informatie aanleveren.

High value data

Voor de publicatie van veel open data is de gemeente zelf verantwoordelijk, zoals de data van de High Value Datalist. Het gaat om gemeentelijke data over raadsverslagen, stemlokalen en meldingen over de openbare ruimte, maar ook bijvoorbeeld de locaties van defibrillators binnen de gemeente. Informatie waar burgers veel aan kunnen hebben. Een 'intermediair', zoals een journalist of een onderzoeker, kan de data bijvoorbeeld gebruiken voor een analyse van stemgedrag in de gemeenteraad per motie per partij.

 

Geen onwil

‘Kleine gemeente gooien een pdf online, maar daar kan je nog niks mee als ontwikkelaar,’ zegt Hablé. ‘Grote gemeenten gebruiken hun eigen standaarden. Als je vergelijkende analyses wil uitvoeren, is dat een heleboel werk, vertellen ontwikkelaars. Ze moeten per gemeenten door de data bladeren en aanpassingen doen.’ Het is geen onwil van de gemeenten, benadrukt hij. De huidige stand van de technologie wordt gewoon nogal eens overschat. Hablé: ‘Gemeenten denken: dat kunnen die data-mensen wel toch? Dat zijn toch heel slimme mensen? Maar het is geen kwestie van één druk op de knop en de dataformaten zijn gelijkgetrokken.’

 

Hybride standaarden

Wat is de juiste standaard? Dat hangt sterk af van de dataset, zegt Hablé. Het is zelfs niet altijd wenselijk om data in dezelfde standaard te hebben. Neem meldingen over de openbare ruimte, waarnaar hij onderzoek deed. ‘Het is niet zinvol om in de gemeente Maastricht een categorie 'zeehaven' in te bouwen. Dus ik geef toe dat het lastig is om overal dezelfde categorieën te gebruiken.’ In zijn onderzoek pleit hij voor hybride standaarden. Vanuit het hergebruikersperspectief is het belangrijk dat er een aantal categorieën zijn waarmee vergelijkende analyses kunnen worden uitgevoerd. Aan de andere kant moet er ruimte zijn voor gemeenten om hun eigen categorieën samen te stellen, zodat het goed bij de context van hun eigen gemeente past.

 

Voorlopers betrekken

Hablé is er geen voorstander van dat Vereniging van Nederlandse gemeenten (VNG) of het ministerie van Binnenlandse Zaken standaarden oplegt aan gemeenten. Volgens hem zijn in eerste instantie de partijen aan zet die open data verwerken, zoals Open State Foundation, Civity, journalisten en academici. Zij moeten beter duidelijk maken op welke manier data het beste kunnen worden gepubliceerd. Om gemeenten vervolgens zo ver te krijgen om de data daadwerkelijk in die standaard te publiceren, moeten BZK en de VNG wèl een ondersteunende rol spelen. Een andere aanbeveling die hij doet, is om voorlopende gemeenten te betrekken bij het ontwikkelen van standaarden. Hablé: ‘Dankzij de nationale standaard zijn data over alle stemlokalen tegenwoordig beschikbaar in hetzelfde formaat, maar sommige gemeenten zijn erop achteruit gegaan. Eindhoven had een mooie standaard ontwikkeld voor de stemlokalen. Die moesten ze wegdoen vanwege de nationale standaard. Dat is zonde. Begin bij wat er al ligt en geef de voorlopers een leidende rol.’

Reacties: 1

U moet ingelogd zijn om een reactie te kunnen plaatsen.

Joop
Het probleem is dat alle data door mensen gelezen en begrepen moeten kunnen worden. Alleen HTML als voorstel is onjuist, ook dan heb je nog steeds een programma nodig die dat vertaald. Alle andere formaten hebben het probleem moeilijk leesbaar te zijn. Het gaat er bij data namelijk om dat deze gecontroleerd kan worden of de data correct is, voldoet aan regelgeving en dat er niet onnodig veel data wordt vrijgegeven. En dat moet met andere pakketten dan die de data ontsluiten, je moet de "source" direct kunnen lezen. Bij uitsluitend machine leesbare formaten ligt "fout" gedrag van grote spelers op de loer die alleen maar bezig zijn zichzelf te verrijken, er zijn inmiddels de nodige voorbeelden gepasseerd. Data die burgers aangaan moeten ook op eenvoudige manier door die burger gecontroleerd kunnen worden. Een antwoord dat alles voldoet is daarmee niet voldoende, je weet niet of een organisatie dan zit te liegen of de waarheid verteld. Er is wat dit aangaat nog een heel lange weg te gaan.
Advertentie