'Autokeuze kan politieke voorkeur voorspellen'
Met de inzet van beeldherkenning op basis van kunstmatige intelligentie analyseerden wetenschappers 50 miljoen Street View-beelden. Het doel van het onderzoek was om te zien of er makkelijker manieren te bedenken zijn om aan demografische gegevens te komen. Voorspellingen doen op basis van automerken bleek verrassend nauwkeurig.
Met de inzet van beeldherkenning op basis van kunstmatige intelligentie analyseerden wetenschappers 50 miljoen Street View-beelden. Het doel van het onderzoek was om te zien of er makkelijker manieren te bedenken zijn om aan demografische gegevens te komen. Voorspellingen doen op basis van automerken bleek verrassend nauwkeurig.
Enquêtes kostbaar
Nu gaan voor dat doel mensen langs in buurten met het verzoek aan bewoners om lange vragenlijsten in te vullen. Dergelijke enquêtes kosten de Amerikaanse gemeenschap jaarlijks 250 miljoen dollar. Bovendien kunnen door de hoge kosten niet alle gebieden in kaart worden gebracht. Gemeenschappen met minder dan 65.000 mensen worden heel vaak niet in het onderzoek meegenomen. De onderzoekers van Stanford University gebruikten voor hun experiment beelden van Google Street View en analyseerden die. Onder meer automerken en types werden daarbij gedetecteerd. In totaal werden 22 miljoen auto's (8 procent van het totaal aantal auto's in de Verenigde Staten) gekoppeld aan 3000 postcodes en 39.000 kiesdistricten. Die gegevens werden gekruist met informatie uit andere bronnen, zoals het bevolkingsregister en de uitslag van de presidentsverkiezingen.
Voorspellingen
Uiteindelijk bleek dat de onderzoekers nauwkeurige voorspellingen konden doen over het inkomen in de buurt, over ras, opleidingsniveau en stemvoorkeuren. Zo blijkt dat wanneer het aantal sedans in een stad groter is dan het aantal pickup-trucks de kans 88 procent is dat de stad bij de volgende verkiezing aan de Democraten toevalt. Wanneer de verhouding andersom ligt, is de kans 82 procent dat de stad stemt voor de Republikeinen.
Enorme tijdswinst
Voor de training van het algoritme hebben eerst enkele honderden mensen auto's in plaatjes geïdentificeerd. De software was vervolgens in staat 50 miljoen plaatjes in twee weken te analyseren. Volgens de New York Times had dat mensen minimaal 15 jaar gekost. De onderzoekers hebben hun resultaten gepubliceerd in het vooraanstaande tijdschrift Proceedings of the National Academy of Sciences. Zij verwachten dat de gebruikte technieken de komende jaren nog verder kunnen worden verfijnd. Het zou dan zelfs mogelijk zijn de statistieken real time aan te passen. De onderzoekers waarschuwen overigens de beleidsmakers wel de nodige voorzichtigheid in acht moeten nemen. De data mag alleen op het niveau van gemeenschappen worden verzameld om er voor te zorgen dat de privacy van individuen kan worden gegarandeerd.
Geen beeldherkenning voor CBS
Dat de methode in Nederland ook toegepast gaat worden lijkt onwaarschijnlijk. Het CBS zegt tegen AG Connect desgevraagd weinig te zien in de voorgestelde methode. 'Het is geen CBS-taak te voorspellen waar op welke politieke partij zal worden gestemd in Nederland. Dat is overigens veel moeilijker dan in de VS waar er maar twee belangrijke partijen zijn en er sprake is van een districtenstelsel', antwoordt Ferry Lapré, woordvoerder van het CBS. 'Dergelijke politieke voorspellingen (met vaak grote marges) laat het CBS over aan onderzoeksbureaus zoals dat van Maurice de Hond. De kwaliteit van politieke voorspellingen op basis van een combinatie van gegevens van Street View met demografische gegevens op buurtniveau lijkt me twijfelachtig. Goede voorspellingen uit het verleden zullen hier geen garanties voor de toekomst kunnen bieden!' Het CBS heeft wel kiezersonderzoeken, maar dat betreft altijd wat gedetailleerdere studies achteraf. 'We doen als CBS in de praktijk van het maken van de officiële statistiek niet aan beeldherkenning.'
Bron: AG Connect
Het herkennen van plaatjes is door de computer gedaan die deze grote snelheid veel sneller kan dan mensen. De rest is door mensen gedaan en ook de uitkomst is niet nieuw, alleen de hoeveelheid.