Door die keuze staat de correctheid en beschikbaarheid van deze gegevens bijna automatisch aan de basis van een goede service aan burgers en andere overheidsinstanties. Daarmee groeit het belang van inzicht in de kwaliteit van gegevens en het vermogen om deze voortdurend verbeteren. Dan kan iedereen met correcte data werken.
Een effectieve aanpak om tot betrouwbare gegevens te komen, vereist twee benaderingen. De een richt zich op het geautomatiseerd verbeteren van de datakwaliteit door data-analyse. En de andere gaat meer over het organiseren van de controle op datakwaliteit, oftewel datamanagement. Dit laatste werkt het best als dit gecentraliseerd plaatsvindt met centraal vastgestelde regels en processen. De verantwoordelijken voor datamanagement registreren de data van alle processtappen binnen een organisatie. Dit gebeurt op basis van centrale definities en controleregels of business rules. Voor de Gemeentelijk Basisadministratie (GBA) is een regel dat het ingevoerde BSN geldig moet zijn. Of dat als het voornaamveld ingevuld is, ook het achternaamveld gevuld moet zijn. De regels kunnen zeer technisch zijn of juist procesgeoriënteerd. Daarom is het van belang dat ook procesverantwoordelijken (niet per se ICT) bij de ontwikkeling en toepassing van regels betrokken zijn. De regels hebben vooral een signaalfunctie met als doel kwaliteitsverbetering. Natuurlijk wel zonder processen te vertragen. Het draait dus niet om het traceren van afwijkingen, maar om het vinden van oorzaken en de vertaalslag naar proces- en kwaliteitsverbetering.
Transparantie
Een krachtig middel om datakwaliteit te verbeteren is door data continu en geautomatiseerd te analyseren en te corrigeren. In de praktijk geldt de vuistregel dat één procent van de data niet klopt. Als dat voor iedere datakolom in een registratie geldt, is dat een probleem. Als centraal uitvoeringsorgaan van ICT-projecten binnen de overheid, heeft het ICTU de opdracht om de nieuwe Registratie Niet Ingezetenen (RNI) op te zetten. Het ICTU heeft bij de pilot voor het vullen van de RNI ervaring opgedaan met data-analyse. Niet-ingezetenen zijn mensen die niet in Nederland wonen, maar wel een relatie met de Nederlandse overheid hebben. De RNI wordt gevuld met de informatie over niet-ingezetenen die is verzameld en opgeslagen door andere bestuursorganen, zoals de GBA, belastingdienst, UWV, SVZ en CVZ.
Goed genoeg?
De kernvraag is: welke gegevens zijn goed genoeg voor gebruik in de RNI? Hiervoor bepaalde het programmateam kwaliteitseisen. De RNI heeft bijvoorbeeld een kleinere dataset dan de GBA. De gegevens van GBA zijn dus 100 procent te benutten. Met de kanttekening dat deze gegevens wel kloppen, maar dat adressen niet altijd actueel zijn. Burgers geven adreswijzigingen namelijk niet altijd door aan hun gemeente. De informatie van de belastingdienst is niet per definitie afleidbaar omdat zij zich primair op heffingen toeleggen. Hierdoor zijn deze gegevens maar gedeeltelijk bruikbaar voor de RNI. Uiteindelijk bleek dat in totaal 2,1 miljoen gegevens geschikt waren voor gebruik in de RNI.
Kwaliteitsnorm
Na de initiële selectie werd meer ingezoomd op de daadwerkelijke kwaliteit van de geleverde data. Met SAS software ging het team op zoek naar afwijkingen (Profiling), zoals ontbrekende gegevens, vreemde tekens en afwijkende lengtes van namen. Andere verschillen zijn te ontdekken door de bestanden van de verschillende instanties over elkaar te leggen (matching). Hierbij komen verschillen in schrijfwijze van een naam bij dezelfde achterliggende adresgegevens of paspoortnummers naar boven. De foutgevoeligheid van matching is eenvoudig aan te passen. Het is aan het team om af te wegen welke kwaliteitsnorm noodzakelijk is.
Optimum bepalen
Het bepalen van een optimum tussen de kwaliteitseisen en toepasbaarheid is zeer lastig en gebaseerd op trial and error. Toch is inzicht in afwijkingen, oorzaken en gevolgen cruciaal voor de datakwaliteit. Die kwaliteitseis is deels afhankelijk van de brondocumenten en regels, maar de kwaliteit van het proces speelt zeker ook een belangrijke rol. Uiteindelijk moet de RNI leiden tot betere dienstverlening. Burgers hoeven door deze aanpak minder vaak informatie aan te leveren. Bovendien is het gegevensgebruik door de overheid transparant. In het verlengde daarvan verbetert de samenwerking tussen overheden de datakwaliteit en de dienstverlening.