of 60831 LinkedIn

Persoonsgegevens GBA gemakkelijk identificeerbaar

Geanonimiseerde gegevens zijn makkelijk tot personen terug te leiden, zo blijkt uit een promotieonderzoek van Matthijs Koot.

Geanonimiseerde gegevens zijn minder anoniem dan gedacht, blijkt uit promotieonderzoek van informaticus Matthijs Koot van de Universiteit van Amsterdam.

Postcode
Koot onderzocht van 2,7 miljoen Nederlanders gegevens uit de gemeentelijke basisadministratie (GBA) over geboortedatum, postcode en geslacht. Daaruit bleek onder meer dat 67 procent van de personen uniek identificeerbaar is op de combinatie van geboortedatum en de vier cijfers van de postcode.


Gegevens wel degelijk te de-anonimiseren
Om een database te anonimiseren worden persoonsgegevens bijvoorbeeld ontdaan van namen en persoonsnummers. Personen zijn dan niet meer geïdentificeerd, maar Koot vroeg zich af of zij dan ook niet identificeerbaar zijn. Zijn onderzoek laat zien dat geanonimiseerde gegevens wel degelijk te de-anonimiseren zijn via postcode, geboortedatum en geslacht, maar ook via andere combinaties. Koot ontwikkelde nieuwe technieken op basis van kansberekening waarmee de mate van privacy kwantificeerbaar is. Op die manier is privacy beter te waarborgen. ‘Ik wil mensen die deze data gebruiken ondersteunen. Het CBS zou een codeboek kunnen maken, waar ook individuen toegang toe hebben. Iedereen kan dan zien dat zij in in hoeverre zij in geanonimiseerde databases, zoals voor patiëntgegevens, niet te onderscheiden zijn.’

Verschillende manieren
De metingen van Koot zijn nooit eerder publiekelijk en zo grootschalig met GBA-gegevens verricht. Hij vroeg gegevens op bij 30 gemeenten. ‘De meer dan 400 gemeenten in Nederland beslissen allemaal zelfstandig of ze aan mijn verzoek willen voldoen. Ik vond het interessant om te zien dat de gemeenten die antwoordden mijn verzoek op zes verschillende manieren werd behandeld. Soms kreeg ik de gegevens direct per onbeveiligde mail, soms moest ik iets ondertekenen en werden gegevens versleuteld aangeleverd op cd-rom. Een gemeente weigerde overigens en 13 gemeenten hebben niet gereageerd of vroegen te hoge leges.’

Bonuskaart
Koot voelt zich betrokken bij de maatschappij, met name op het gebied van privacy. ‘Dan kom ik op het “evangeliserende gedeelte” van mijn proefschrift. Je kunt pas goede beslissingen nemen als je goed bent geïnformeerd. De gegevens van het GBA zijn maar voor een paar mensen toegankelijk, maar gegevens als postcode, geboortedatum en geslacht worden ook, met je naam erbij, geregistreerd bij de Bonuskaart van Albert Heijn of bij Bol.com. Kwaadwillenden die zich toegang kunnen verschaffen tot zulke databases kunnen er heridentificatie-aanvallen mee uitvoeren op onvoldoende geanonimiseerde data. Die kwaadwillenden kunnen die gegevens trouwens ook al gedeeltelijk verzamelen van sociale media als Facebook of LinkedIn. Veel mensen zetten daar hun geboortedatum en woonplaats op.’

Niet herleidbaar
Het gaat Koot om gegevens die door organisaties, maar ook door huisartsen, apothekers of enquêtebureaus, als anoniem worden voorgesteld en worden gedeeld voor bijvoorbeeld beleidsonderzoek. ‘Het GBA bevat geïdentificeerde data. Dat is noodzakelijk. Als voor wetenschappelijk onderzoek GBA-gegevens worden gevraagd, kunnen die gegevens bijvoorbeeld zonder naam of burgerservicenummer worden verstrekt. Maar je moet ook afwegen of bij de rest van de gegevens de identiteit van mensen niet herleidbaar is.’

Privacytoets
Als informaticus is Koot uit zichzelf al extra voorzichtig omgegaan met de verstrekte gegevens door ze bijvoorbeeld dubbel te versleutelen en niet op draagbare media op te slaan. ‘Ik vraag me af in hoeverre persoonsgegevens die tijdens wetenschappelijk onderzoek worden verwerkt voldoende worden beveiligd.

Je moet de anonimiteit van geanonimiseerde gegevens kunnen waarborgen. Ik pleit daarom voor het invoeren van een privacytoets op basis van kansberekeningmodules, zodat je kunt controleren of de gegevens voldoende geanonimiseerd zijn.’

Verstuur dit artikel naar Google+

Gerelateerde artikelen

Reageer op dit artikel
Even geduld a.u.b.

Reactie op dit bericht

Door Mark Watson op
Matthijs, Dank! Het lezen waard.

Wat me opvalt in de toon van het artikel en vele van de reacties is de focus op overheid. Dat terwijl de eerste de beste internet provider, postorder firma, what's app, etc. over aanzienlijk meer persoonsinformatie beschikt.
Door Hirundea op
Aan de ene kant maakt men zich zorgen om privacy maar aan de andere kant worden prive gegevens vaak door dezelfde personen tot in detail op facebook, hyves, youtube en twitter, etc. vermeld. Misschien de schrizofenie van de privacy?
Door Opmerker op
Onze identiteit ligt al enige jaren "op straat". Los van het idee dat identiteit moet worden gerespecteerd door de instanties (mensen) die met zulke gegevens werken, is het ook aan de vinder van losgeraakte info, de taak eerbiedig daarmee om te gaan. En wat je dus aantreft, weer retourneren.
Opvoeding thuis is ook dáárvoor.
Door Ambtenaar op
Dat dit nu eens publiekelijk aan de kaak gesteld wordt laat privacy gevoeligheid misschien weer wat herleven.
Ik zou het zeer op prijs stellen als de steeds verdergaande privacy schendingen nota bene door onze eigen overheid door steeds meer (en buiten proportionele) gegevenskoppelingen ook eens nader onderzocht en aan de kaak gesteld zou worden.
Ik voel me intussen een roepende in de woestijn.
Door Mark Watson op
Ik neem aan dat het onderzoek veel verder ging dan dit simpele feit. Dit op zich is geen promotie waard. In de wereld van de GBA is dit al lang bekend. Het aspect dan andere registraties hier minder zorgvuldig mee omgaan blijft wat mij betreft hier onderbelicht.