Column Jean Wanningen: "Hoe gevaarlijk is big data?"

Nieuws•03 mei 2017, 15:30

Alles wat we doen, zowel on- als offline, laat digitale sporen na. Vrijwel elke aankoop die we doen met een pasje, zowel online als bij Albert Heijn, vrijwel elke Google-search, vrijwel elke stap die we maken met een mobiele telefoon op zak, elke 'like' wordt opgeslagen. Maar hoe wenselijk is deze opslag eigenlijk? Kunnen al die gegevens worden gebruikt om gedrag te manipuleren? Gevreesd moet worden van wel.

Menselijk gedrag is inherent onvoorspelbaar, zo heet het. Immers, mensen acteren niet louter rationeel. Maar met behulp van Kunstmatige Intelligentie worden algoritmes ontwikkeld die niet alleen vele malen sneller dan mensen accurate voorspellingen kunnen doen, maar ook nog eens stukken betrouwbaarder. En de ontwikkelingen gaan snel. Big data analyse verovert de wereld.

De Psychometrie is de wetenschap die zich bezighoudt met de technieken van het meten van psychologische fenomenen zoals kennis, vaardigheden, attituden, eigenschappen en persoonskenmerken. In de jaren tachtig van de vorige eeuw ontwikkelden twee teams van psychologen een model dat mensen probeerde in te delen op basis van vijf persoonlijkheidskenmerken, bekend als de 'Grote Vijf'. Deze vijf factoren staan ook bekend als OCEAN (Openness, Conscientiousness, Extroversion, Agreeableness en Neuroticism). Oftewel: hoe open sta je tegenover nieuwe ervaringen?; hoe perfectionistisch ben je?; hoe sociaal ben je?; hoe attent en meegaand ben je?; en hoe snel ben je overstuur?

Op basis van deze factoren kunnen we in de praktijk een redelijk betrouwbare inschatting maken van het soort persoon die we tegenover ons hebben. Met inbegrip van hun behoeften, angsten, en hoe ze zich zullen gaan gedragen. De 'Grote Vijf' is een standaardmethode geworden van psychometrie. Lang was het probleem met deze benadering het verzamelen van data, omdat het maken van de analyse het invullen van een uitgebreide en persoonlijke vragenlijst vereiste. Maar toen kwam het internet. En sociale media als Facebook en Twitter.

De Pool Michal Kosinsky en zijn team aan het Psychometrie Centrum van de Universiteit van Cambridge ontwikkelden een app die het mogelijk maakte voor de deelnemers om verschillende psychometrie-vragenlijsten in te vullen. Op basis van de evaluatie ontvingen gebruikers een 'persoonlijkheidsprofiel' – gepersonaliseerde Grote Vijf-waarden – en konden ze ervoor kiezen hun Facebook-data te delen met de onderzoekers. Het bleek, dat op basis van simpele online activiteiten opvallend betrouwbare voorspellingen te doen over hoe mensen zich zullen gedragen. Voor de goede orde: het gaat hier dus niet zozeer over de betrouwbaarheid van modellen of vragenlijsten als ‘de Grote Vijf’, maar juist over wat we nog niet weten. Het gaat om het verzamelen van enorme hoeveelheden data waarmee hele kleine patronen herkend kunnen worden, waarmee vervolgens redelijk betrouwbare gedragsvoorspellingen gemaakt kunnen worden.

En ofschoon elk stukje informatie op zichzelf onvoldoende is om een betrouwbare voorspelling te doen, blijkt dat tientallen, honderden of duizenden gelinkte datapunten wel een stevige basis geeft om accurate voorspellingen te kunnen doen. In 2012 bewees Kosinski dat op basis van gemiddeld 68 facebook-likes per gebruiker het mogelijk was om hun huidskleur te voorspellen (met 95 procent accuraatheid), hun seksuele oriëntatie (88 procent accuraat), en hun affiliatie met de Democratische of Republikeinse Partij (85 procent). Maar daar bleef het niet bij. Intelligentie, religieuze achtergrond, en alcohol-, sigaretten- en drankgebruik konden allemaal worden vastgesteld. Uit de data bleek het zelfs mogelijk te achterhalen of iemands ouders gescheiden waren, zo blijkt uit dit artikel van Motherboard. Zeventig likes waren genoeg om meer over een persoon te weten dan vrienden, 300 likes waren ervoor nodig om meer te weten over iemand dan zijn of haar partner.

Hiernaast bleek het gebruik van onze smartphone een ‘enorme psychologische vragenlijst die we constant invullen, zowel bewust als onbewust’, aldus Kosinsky. Maar belangrijker nog dan die invul-vragenlijsten is dat de psychologische profielen gebruikt kunnen worden om naar gelijkgestemden te zoeken. In feite heeft Kosinsky een soort mensen-zoekmachine uitgevonden. En die kunnen politieke partijen gebruiken bij het zoeken naar zwevende kiezers die ze met gerichte vragen kunnen overhalen om op hun partij te stemmen. En dat is ook gebleken. Begin 2014 werd Kosinsky benaderd door een zekere Alexandr Kogan, die zich voordeed als psychologisch onderzoeker. Vermoed wordt dat Kogan de app van Kosinsky heeft gecopieerd en heeft doorverkocht aan het bedrijf Strategic Communication Laboratories (SCL).

Een afsplitsing van SCL, de firma Cambridge Analytica, verklaarde na afloop van de Trump verkiezing bij monde van haar ceo Alexander James Ashburner Nix: ‘We zijn blij dat onze revolutionaire benadering van door data gedreven communicatie zo'n grote rol heeft gespeeld bij de verkiezing van Donald Trump.’ Het heeft er alle schijn van dat Cambridge Analytics ook een rol heeft gespeeld bij de Leave-campagne tijdens de Brexit, hoewel daar geen harde bewijzen voor zijn. Het blijft onduidelijk hoe nauw Cambridge Analytica betrokken was bij de Brexit-campagne, omdat Cambridge Analytica weigerde zulke vragen te beantwoorden. Opvallend is wel dat de Amerikaanse president Trump twitterde: ‘Binnenkort noemen jullie mij Mr. Brexit’. Maar er is ook veel kritiek. In dit prima artikel van Maurits Martijn worden de nodige terechte vraagtekens geplaatst bij de claim van Nix.

Bewijzen valt er vooralsnog nog niets, maar het valt evenmin uit te sluiten dat bijvoorbeeld de komeetachtige populariteitsstijging van de Franse presidentskandidaat Emmanuel Macron geholpen is met de methode Kosinsky door Cambridge Analytica, al is ook dat voer voor speculanten. Volgens ceo Nix is het succes van Cambridge Analytica's marketing gebaseerd op een combinatie van drie elementen: gedragswetenschap met behulp van het OCEAN-model, big data-analyses, en advertentie-targeting. Dat laatste komt neer op gepersonaliseerde advertenties, zo precies mogelijk gericht op de persoonlijkheid van een individuele consument, schrijft Motherboard. Volgens Nix heeft zijn bedrijf alle 220 miljoen volwassenen in de VS ‘gepersonaliseerd’. In de VS kan dat ook makkelijker, omdat daar alle mogelijke databases gewoon te koop zijn. In Europa vereisen privacywetten momenteel dat een persoon specifiek toestemming geeft om data beschikbaar te maken, maar in de VS is dat andersom: de data zijn vrij toegankelijk tenzij iemand bezwaar maakt.

De voorlopige conclusie lijkt toch te zijn, dat met behulp van de psychometrische methode van Cambridge Analytica stemgerechtigden van alle pluimages op specifieke wijze benaderd kunnen worden. En dus ook beïnvloed. Als blijkt dat stemgedrag en consumentengedrag nauwkeurig kan worden voorspeld op basis van ‘personality targeting’, dan roept dat natuurlijk de vraag op: willen we dat?

In een recent artikel in Trouw waarschuwde hoogleraar cybersecurity en computerbeveiliging Bart Jacobs voor privacy risico’s van de toenemende digitalisering van onze samenleving. ‘Ons functioneren als vrije, autonome individuen staat of valt met privacy’, schrijft Jacobs. Drogredeneringen als ‘Privacy is de schuilplaats van het kwaad’ en ‘Wie niks te verbergen heeft, heeft ook niks te vrezen’ doen volgens Jacobs geen recht aan het subtiele karakter en het grote maatschappelijke belang van privacy. Hij komt daarom met zes aanbevelingen voor het toekomstig kabinet om die privacy beter te waarborgen. Kortgezegd zijn dat de volgende aanbevelingen.

Allereerst: beschouw privacy en gegevensbescherming als ‘het nieuwe groen’. Daarmee bedoelt Jacobs dat het tot aanbeveling strekt dat er – analoog aan hogere klimaateisen - strengere regels moeten komen om onze privacy te waarborgen. Gegevensbescherming is ‘essentieel voor een duurzame digitale omgeving’.

Verder: maak gegevensbescherming onderdeel van de cybersecurity-agenda. Duitsland geeft het goede voorbeeld: bij grote ICT-projecten dient minstens tien procent van de uitgaven besteed te worden aan cybersecurity én privacy, aldus Jacobs.

De derde aanbeveling luidt dat mensen soms tegen zichzelf in bescherming genomen moeten worden. Als voorbeeld noemt hij orgaandonatie. Dat zou verboden moeten worden, omdat anders financiële prikkels de doorslag geven in plaats van altruïsme. Jacobs: ‘Waarom plaatsen we medische persoonsgegevens dan niet ook buiten de handel, juist om ervoor te zorgen dat medische gegevens in een medische context blijven? Tegenover de disproportionele macht en invloed van de Big IT moet tegenmacht georganiseerd worden, zo nodig met enig verlicht paternalisme.’

Zijn vierde aanbeveling luidt: herken en bescherm ‘de publieke zaak’ in de digitale wereld. Steden worden verleid om ‘smart’ te worden, wat vaak betekent dat inwoners hun gegevens moeten inleveren. Wie kijkt hier kritisch naar en komt op voor het algemeen belang, vraagt hij zich af.

De vijfde aanbeveling luidt: introduceer nieuwe rechten om informatie te ontvangen zonder toezicht en profilering. Vrijheid van meningsuiting is een kernwaarde in onze moderne samenleving, maar de vrijheid om wel of geen informatie te ontvangen is minstens zo belangrijk, vindt Jacobs.

Nieuwe media bepalen wat je te zien krijgt, vanuit hun eigen commerciële dan wel politieke belangen en die van hun adverteerders. Zo beland je in een zogeheten filterbubbel, waarin je verstoken blijft van allerlei informatie en soms zelfs nepnieuws krijgt voorgeschoteld. Wat we nodig hebben is het ‘recht om niet te worden bespied’ en een ‘recht om niet te worden geprofileerd’, aldus de hoogleraar.

En tenslotte de zesde aanbeveling: Behandel grote ICT-ondernemingen als nutsbedrijven en dwing ze tot opsplitsing. Jacobs: ‘Vanuit welbegrepen publiek belang zijn nutssectoren als gas, water, licht en telecommunicatie zwaar gereguleerd. Het wordt hoog tijd dat dit ook gebeurt met digitale diensten, omwille van diezelfde publieke zaak. Daarbij is het verstandig om dergelijke diensten van elkaar te scheiden, zodat een bedrijf niet tegelijkertijd activiteiten op medisch gebied kan ontplooien, advertenties kan verkopen of sociale media mag bestieren. Ook dit om onze gegevens binnen één context te kunnen houden en onze privacy en autonomie te garanderen.’

Dit lijken mij alle zes zinvolle aanbevelingen voor toekomstig overheidsbeleid, zeker in het licht van de personality targeting methoden, zoals hierboven beschreven. Het moet voor de internetgebruiker volkomen transparant zijn wat er met zijn of haar gegevens gebeurt. Nu is dat niet duidelijk. Het is een grote ‘Black Box’. Want verdere doorontwikkeling van die methoden zullen ertoe leiden dat we in de toekomst als makke schapen gedrild kunnen worden door onze autoriteiten of wie er dan ook aan de touwtjes moge trekken. En ook al is deze manipulatie nu nog niet honderd procent mogelijk, als we vrij willen zijn en blijven zullen we de vraag moeten stellen in welke mate digitalisering onze levens (en gedachten) mogen gaan bepalen.

Dit artikel is mede tot stand gekomen door inbreng van mijn zoon Daan Wanningen, researchmaster student Artificial Intelligence.

Column Jean Wanningen: "Hoe gevaarlijk is big data?"

doorJean Wanningen

Rechts geweld? Nee, links terrorisme!

Goedkope begrafenis regelen? Let goed op, want de prijzen kunnen per gemeente sterk verschillen

Van Weel wil tijdelijke wet tegen terrorisme blijvend maken

Washington klaagt LA aan om immigratieaanpak

Douwe Bob ziet geen meerwaarde in koffiedrinken met Yeşilgöz

Lees ook

Van Weel wil tijdelijke wet tegen terrorisme blijvend maken

Washington klaagt LA aan om immigratieaanpak

Douwe Bob ziet geen meerwaarde in koffiedrinken met Yeşilgöz

Van Weel wil tijdelijke wet tegen terrorisme blijvend maken

Washington klaagt LA aan om immigratieaanpak

Douwe Bob ziet geen meerwaarde in koffiedrinken met Yeşilgöz

Prinses Amalia gaat opleiding volgen aan Defensity College

IND mag deel van tweestatusstelsel later invoeren

Kabinet houdt ontmoedigingsbeleid nederzettingen tegen het licht