Overslaan en naar de inhoud gaan

Wordt informatieautonomie de gamechanger voor de overheid?

Door anders met data om te gaan en computerkracht beter te benutten, kan er véél meer, aldus Martijn Aslander en Kees Verhoeven.

Portretten van Martijn Aslander en Kees Verhoeven, beide met armen over elkaar
Martijn Aslander (links) en Kees Verhoeven - Elizabeth Wattimena

Een totaal andere omgang met informatie, met mogelijk grote gevolgen voor de overheid. Daar draait de ­pilot informatieautonomie om. Initiatiefnemer Martijn Aslander en ambassadeur van de pilot Kees Verhoeven zijn overtuigd van het potentieel.

Stomverbaasd hoe snel het gaat

Stel dat er een methode was om razendsnel de beslistermijnen van alle lopende Woo-verzoeken binnen de organisatie te achterhalen. Of om alle informatie uit bouwtekeningen in de gemeente in een oogwenk te categoriseren. Om de afhandeling van het Toeslagenschandaal binnen enkele weken voor eens en voor altijd af te ronden. Onmogelijk, zegt u. Toch kan het, stelt Martijn Aslander, initiatiefnemer van de pilot informatieautonomie. De pilot onderzoekt hoe overheidsinformatie beter kan worden vastgelegd, geordend en teruggevonden in het bestandsformaat Markdown. ‘Wij zijn hier iets wezenlijk anders aan het doen met informatie dan wat mensen kennen’, zegt hij. ‘En we zijn elke keer stomverbaasd hoe snel het gaat’.

Wij zijn hier iets wezenlijk anders aan het doen met informatie dan wat mensen kennen.

Martijn Aslander

Door anders met data om te gaan dan we gewend zijn en de rekenkracht van de computer beter te benutten, kan er veel meer dan we altijd dachten. Dat zegt niet alleen Aslander, dat zegt ook ondernemer en voormalig Tweede Kamerlid Kees Verhoeven, die zich als ambassadeur van de pilot heeft opgeworpen.

‘Ik heb echt het gevoel dat hij de kern raakt’, zegt Verhoeven over Aslanders initiatief. Andere klinkende namen die bij de pilot betrokken zijn onder meer voormalig ­regeringscommissarissen Informatiehuis­houding Bas Eenhoorn en Arre Zuurmond en cyberveiligheidsexpert Brenno de Winter.

Het belangrijkste overheidsnieuws van de dag

Schrijf je in voor de Binnenlands Bestuur nieuwsbrief

ThetaOS

Om te begrijpen waar het enthousiasme vandaan komt, is een duik in de nog jonge ontstaansgeschiedenis van de pilot noodzakelijk. In het najaar van 2025 bouwde Aslander zijn eigen, hyperpersoonlijke ­informatiesysteem, ThetaOS. Het eerste uitgangspunt achter dit systeem is dat informatie niet in data zit, maar in de verbindingen tussen data. Aslander noemt dit informatiseren: informatie met elkaar verbinden. De kerngedachte achter zijn informatiesysteem is dat er van alles maar één is, zodat je altijd weet wat het is. Dat legt hij uit aan de hand van een voorbeeld. ‘Ik wilde van Gmail af en daarom haalde ik mijn Gmail-archief binnen, 14 GB aan data. Als je honderd mailtjes op een dag krijgt, dan staat die datum er ook honderd keer in, terwijl er maar één 1 januari 2026 bestaat. Hetzelfde geldt voor namen. Er is maar één Kees Verhoeven, ook al staat hij negenduizend keer in mijn mailbox. Ik maak er één Kees Verhoeven van. Er is maar één Groningen. Nou vooruit, er zijn er twee: een stad en een provincie. De provincie is dan Groningen 2. Ik noem dit proces dedupliceren, oftewel rigoureus ontdubbelen. Als je alle data analyseert en schoon zeeft, dan kun je
90 procent weggooien.’

Als je alle data analyseert en schoon zeeft, dan kun je 90 procent weggooien.

Martijn Aslander

Het tweede uitgangspunt is dat we doorgaans de verkeerde bestandsformaat­familie gebruiken, namelijk van bestandsformaten die computers niet zelf kunnen uitgelezen. Je hebt bijvoorbeeld Word nodig om een .docx-formaat te lezen en Adobe Acrobat voor een pdf-formaat. Ook open source software valt wat Aslander betreft onder de ‘verkeerde’ formaten, omdat ook hiervoor externe software nodig is om de data machineleesbaar te maken. Een aantal bestandsformaten behoort tot een andere familie, waaronder Markdown, Java, HTML, .txt, JSON en CSV. Omdat de computer deze formaten zelf kan uitlezen, kan de rekenkracht van de computer optimaal worden ingezet. Aslander: ‘Waarom zijn taalmodellen zo snel? Omdat alle AI-partijen hun informatie wel in het outputformaat Markdown bewaren.’ Markdown is een moderne, gestructureerde variant van het klassieke tekstbestand (.txt), waarin opmaak en metadata in het document zelf zijn opgenomen.

Complete bibliotheken op een laptop

Het resultaat is een database vol stukjes platte tekst uit verschillende bronnen (een lexicon) waarvan er van ieder onderdeeltje maar één is (entiteiten). Er bovenop komt een laag met optical character recognition (OCR), patroonherkenning uit afbeeldingen van teksten. Met behulp van agentic AI zoekt het systeem volautomatisch naar verbindingen tussen de entiteiten. Een vraag als ‘Hoe vaak waren Martijn en Kees in Groningen?’ is daardoor razendsnel beantwoord. ‘In dit proces gaat geen enkele betekenis verloren’, zegt Aslander. ‘En omdat je van alles maar één hebt, houd je maar een paar honderd MB data over.’

Het belangrijkste overheidsnieuws van de dag

Schrijf je in voor de Binnenlands Bestuur nieuwsbrief

Dat gebrek aan gewicht is cruciaal. Het zorgt ervoor dat Aslander complete bibliotheken aan openbare informatie kwijt kan op zijn laptop en toch maar 300 MB kwijt is. Met behulp van het systeem doorzoekt hij bijvoorbeeld complete oorlogsarchieven, waarbij hij ontdekkingen doet die betrokkenen steil achterover doen slaan.

Het systeem vindt sporen die ik zelf nog niet had gezien of nooit had kunnen vinden.

Monique Brinks, WO2Net

Pilotdeelnemer en geschiedkundige Monique Brinks van WO2Net zegt: ‘Het systeem vindt sporen die ik zelf nog niet had gezien of nooit had kunnen vinden. Het haalt bijvoorbeeld alle MI5-files op en vindt daaruit allerlei verbanden waarvan Lou de Jong nooit heeft geweten. Ik verwacht dat er de komende jaren heel veel nieuwe ontdekkingen aan het licht komen.

Agentic AI voor het crosschecken van bronnen

Een logische vraag is hoe betrouwbaar de resultaten zijn. Volgens Aslander zit de kracht van agentic AI in het crosschecken van bronnen. ‘Als je meerdere AI-bots ­loslaat op dezelfde vraagstukken, dan kunnen zij de gevonden informatie uit verschillende bronnen met elkaar kruisen en factchecken. AI kan goed redeneren en afleiden wat wat is.’ Hiervoor gebruikt hij de Command Line Interface (CLI), de onder-de-motorkap-versie van Claude. Het oogt als een MS DOS-scherm uit lang vervlogen tijden. Aslander spreekt zijn vragen in, het systeem antwoordt met ­geschreven tekst.

Wat maakt dit anders dan retrieval-augmented generation (RAG), het ophalen van relevante informatie door taalmodellen uit interne databronnen? ‘Een RAG kan wel patronen opsporen, maar wat wij doen is veel eleganter: extreem gestructureerd informatie ontwerpen. Mijn dataset is zo gemetadateerd en kent zoveel bewijslagen dat ik erop kan leunen.’ Hij stelt dat slechts twee procent van het systeem bestaat uit AI.

Pilot informatieautonomie

Binnen de pilot informatieautonomie onderzoekt een negenkoppig team samen met diverse overheidsinstellingen wat deze methode de overheid kan opleveren. Onder meer het UWV, de veiligheidsregio’s, de Belastingdienst, de politie en verschillende archieven doen mee. De pilot wordt bekostigd door de deelnemers. In de eerste pilotfase werd onderzocht of het überhaupt mogelijk is om met de andere bestandsformaatfamilie te gaan werken. De eerste impuls is om te denken dat de eigen organisatie niet zonder Word kan, maar dat blijkt mee te vallen. ‘Iedere keer dat iemand een beer op de weg vond, bleek het probleem oplosbaar’, vertelt Verhoeven. ‘We kunnen bijvoorbeeld prima zwart lakken zonder Word-software.’

We kunnen prima zwart lakken zonder Word-software.

Kees Verhoeven

Institutioneel lef nodig

Aslander en Verhoeven geloven dat de ­implicaties gigantisch zijn. Denk aan alle ingewikkelde dossiers waar de overheid mee worstelt, van het aardbevingsdossier tot het Toeslagenschandaal. Aslander zou maar wat graag de onlangs gevonden ‘kluis’ van het Toeslagenschandaal doorzoeken. ‘Ik weet zeker dat mijn team daar in een uur tijd dingen boven water krijgt, waar honderd consultants maanden over doen.’

Wat is ervoor nodig om het systeem bij de overheid ingeburgerd te krijgen? ‘Institutioneel lef. Iemand moet ja zeggen in plaats van nee.’

Dit is een ingekort versie. Lees het volledige artikel binnenkort in Binnenlands Bestuur #12 (inlog) of in iBestuur #59 Nog geen (gratis) online abonnement op iBestuur? Klik HIER

Copilot en ChatGPT in de publieke sector

Copilot en ChatGPT in de publieke sector

Benut je de kracht van AI al optimaal in jouw organisatie? Ontdek hoe je met AI-tools als ChatGPT en Copilot je informatiebeheer en besluitvorming naar een hoger niveau tilt.

schrijf u vandaag nog in

Plaats als eerste een reactie

U moet ingelogd zijn om een reactie te kunnen plaatsen.

Melden als ongepast

Door u gemelde berichten worden door ons verwijderd indien ze niet voldoen aan onze gebruiksvoorwaarden.

Schrijvers van gemelde berichten zien niet wie de melding heeft gedaan.

Bevestig jouw e-mailadres

We hebben de bevestigingsmail naar %email% gestuurd.

Geen bevestigingsmail ontvangen? Controleer je spam folder. Niet in de spam, klik dan hier om een account aan te maken.

Er is iets mis gegaan

Helaas konden we op dit moment geen account voor je aanmaken. Probeer het later nog eens.

Maak een gratis account aan en geniet van alle voordelen:

Heeft u al een account? Log in

Maak een gratis account aan en geniet van alle voordelen:

Heeft u al een account? Log in