of 59250 LinkedIn

Correlatie en Mozzarella

Vorig jaar heb ik samen met mijn studiegenoten een kijkje in de keuken mogen nemen bij IBM Watson. We leerden over het gebruik van big data, het benodigde fundament hiervoor en mogelijke toepassingen van big data. We leerden dat een van de belangrijkste dingen die we moeten onthouden bij het gebruik van big data toch wel het feit is dat computers correlaties meten, geen causaliteit.

Zo werden we gewezen op het bestaan van een website die wel heel bijzondere linkjes legt. Hier wordt een relatie aangetoond tussen de consumptie van margarine en het aantal scheidingen, en tussen het aantal behaalde doctoraten en de consumptie van mozzarella. Je zou zomaar kunnen zeggen dat wanneer de bevolking meer mozzarella eet, er ook meer mensen promoveren. Computers meten enkel de correlatie. Wanneer twee zaken door menselijke tussenkomst aan elkaar gelinkt worden (mozzarella en promoveren), kan een systeem er van maken dat er sprake van een relatie is. Computers zoeken niet naar causaliteit en stellen zichzelf niet de vraag waaróm iets zo is. Eén en één is immers altijd twee.

 

Een van de risico’s die je loopt bij het gebruik van big data en computergestuurde (ondersteuning van) besluiten is het zogenaamde illusoire-correlatie-effect. Dit effect ontstaat wanneer zowel de leden van een groep als een bepaald soort informatie in de minderheid zijn: allebei tegelijk komen ze relatief weinig voor. Op het moment dat die twee samen voorkomen valt dat op (‘paired distinctiveness’). Het aantal leden van een minderheidsgroep met een kenmerk dat weinig voorkomt wordt hierdoor overschat. Dit effect zien we bijvoorbeeld regelmatig rondom de negatieve stereotypering van minderheden. Hoewel negatief gedrag over het algemeen minder vaak voorkomt dan positief gedrag, valt dit gedrag sneller op. Wanneer je een paar keer negatief gedrag bij een minderheidsgroep waarneemt kan dit leiden tot een overschatting van het aantal keer dat dit voorkomt in deze groep. Het leidt vaak tot een (valse) bevestiging van negatieve stereotypering en dat maakt mij toch wel een beetje angstig.

 

Maar er is nog een ander risico. In ons college vertelt Marlies van Eck deze week over haar promotieonderzoek naar computerbesluiten en de bescherming van burgers. Wanneer de overheid computers gebruikt bij het nemen van besluiten, zoals bijvoorbeeld bij het verlenen van toeslagen of het vaststellen van inkomstenbelasting, is het vaak niet duidelijk hoe deze besluiten worden genomen. Wanneer verschillende overheidsinstanties dan ook nog eens elkaars computerbesluiten overnemen, dan is het einde helemaal zoek. Hoe kan de rechter, wanneer een burger een besluit aanvecht, nog oordelen over de rechtmatigheid van een niet te doorgronden computerbesluit? Van Eck vreest dat computervoorspellingen steeds belangrijker maar ook steeds onaantastbaarder worden, juist door de schijn van objectiviteit van het niet te doorgronden besluit.

 

Er zitten risico’s aan het aanzien van een correlatie voor causaliteit. Dat begrijp ik. Maar toch, er is duidelijk meer mozzarella gegeten in het jaar dat er meer doctoraten werden behaald. Als ik ooit nog wil promoveren ga ik tóch maar flink aan de mozzarella. Je weet immers maar nooit.

Columnreeks

Deze column maakt onderdeel uit van een tweewekelijkse reeks, waarin Jonge Informatieprofessional Ilse de Jonge schrijft over iets wat ze meemaakt in haar dagelijks leven. Over de relatie tussen overheid en burger en de invloed van digitalisering op de samenleving. Over wat ze ziet tijdens haar werk als Jonge Informatieprofessional of leert tijdens haar opleiding, de Master of Public Information Management (MPIM). Over de invloed van digitalisering, het nieuws en de wereld om haar heen, maar ook over haar collega's, ambtenaren, borrelen op het plein en vergaderingen op maandagochtend.

Lees hier de andere columns van Ilse
Verstuur dit artikel naar Google+

Reageer op dit artikel
















Even geduld a.u.b.

Contactgegevens

AfbeeldingMuzenstraat 120,

2511 WB Den Haag,

Postbus 18607,

2502 EP Den Haag

070- 376 36 36

info@pblq.nl

www.pblq.nl

Meer nieuws

 

Meer weten over ons Informatiemanagement Traineeship, bekijk hier de website.

Opleiding Informatiemanagement voor verbinders

Metropool opleiding

Weten hoe het is om bij PBLQ te werken?

Blijf effectief in de informatiesamenleving van morgen!

Afbeelding

Whitepapers

  • ‘Smart’ lijkt wel een nieuw toverwoord. Net zoals innovatie dat ook al enige jaren...

    Smart city

    ‘Smart’ lijkt wel een nieuw toverwoord. Net zoals innovatie dat ook al enige jaren...
  • Voor bestuurders, managers en veranderaars 
 Met de digitalisering van onze samenleving is het...

    Safe in cyberspace

    Voor bestuurders, managers en veranderaars Met de digitalisering van onze samenleving is het...

Bloggers