Winkelmand

Geen producten in de winkelwagen.

Data en ethiek: zo zet je data verantwoord in

In samenwerking met - Data en ethiek vormen een spanningsveld. Desinformatie en privacyproblemen liggen op de loer. Hoe ga je er op verantwoorde wijze mee om? Drie aandachtsvelden.

Foto: Alexander Sinn

Wie in een zoekmachine de term ‘coronavirus feiten’ intypt, krijgt volstrekt andere zoekresultaten te zien dan wanneer iemand ‘coronavirus waarheid’ intypt. In het eerste geval word je verwezen naar statistieken en cijfers van hoofdzakelijk officiële bronnen, in het tweede geval is de kans groot dat je al op de eerste pagina geconfronteerd wordt met complottheorieën (“Chinese vrouw onthult ‘waarheid’ over virus in heftig filmpje”). Een vergelijkbaar resultaat krijg je als je respectievelijk ‘vaccin feiten’ en ‘vaccin waarheid’ intypt.

Betrouwbaarheid van informatie checken

Met andere woorden, hoewel ‘feiten’ en ‘waarheid’ voor ons gevoel ongeveer dezelfde betekenis hebben, blijken ze in de digitale wereld te leiden tot totaal verschillende uitkomsten. Hoe gaan wij daarmee om bij het zoeken naar betrouwbare informatie?

Allereerst moeten we een onderscheid maken tussen de termen desinformatie en misinformatie:

  • Desinformatie is content die doelbewust onjuist is en erop gericht is om schade aan te richten.
  • Wanneer desinfomatie wordt gedeeld, wordt het vaak misinformatie. Misinformatie beschrijft ook onjuiste content, maar de persoon die het deelt weet dat niet. Hij of zij deelt desinformatie met als doel om anderen te ‘helpen’.

Je moet data dus kunnen verifiëren op juistheid.

5 basis stappen voor verificatie van informatie

  1. Herkomst: betreft het een origineel artikel, dan wel van een oorspronkelijk account?
  2. Bron: wie schreef het artikel of van wie is de account, dan wel wie heeft het origineel verspreid? Met andere woorden: is de bron authentiek en betrouwbaar?
  3. Datum: van wanneer dateert het artikel/de content? Is het van recente datum of van jaren terug? Tijdens de branden in het Amazonegebied in 2019 werden video’s verspreid die jaren eerder waren opgenomen.
  4. Locatie: waar is de website/account gevestigd of de informatie vandaan gehaald? Foto’s/video’s/tekst blijken soms afkomstig van totaal andere locaties, dan in berichten vermeld wordt.
  5. Motivatie: wat is de bestaansreden van de website/account of van de content die verspreid wordt? Het is meestal gauw duidelijk of informatie afkomstig is van een gecertificeerde instelling, dan wel een autoriteit op zijn gebied of een bedrijf met gevestigde reputatie.

Twijfel je over een van bovenstaande punten, dan doe je er goed aan de data niet voor publicatie of verspreiding te gebruiken.

Is dit verificatieproces onfeilbaar? Nee, maar door het verzamelen van geautoriseerd bewijsmateriaal kom je wel dichter bij de waarheid. In feite passen onderzoekers (en onderzoeksjournalisten) deze methode ook toe bij het naspeuren van materiaal op internet. Zij maken daarbij gebruik van geavanceerder technieken. Zo ontwikkelden de factcheckers (verbonden aan RU Leiden) met behulp van AI een tool om automatisch uitspraken in Kamerdebatten of tweets van politici te controleren op feitelijke juistheid.

Data van klanten: kwaliteit en veiligheid

Tot nu toe hebben we het over data gehad, die wij halen uit externe bronnen. Maar hoe zit met onze eigen data? En, misschien nog belangrijker: de informatie over onze klanten. Beschermen we die wel goed?

Uiteraard moet de data van je organisatie voldoen aan de Algemene verordening gegevensbescherming (AVG). Wat veel organisaties nìet weten, is dat zij ook verplicht kunnen zijn om een zogenoemde Data protection impact assessment (DPIA) uit te voeren. De Autoriteit Persoonsgegevens heeft een lijst gepubliceerd met soorten verwerkingen van persoonsgegevens waarvoor een DPIA verplicht is.

Zorg ervoor dat het privacybeleid van je organisatie makkelijk toegankelijk is en voldoet aan de laatste wettelijke vereisten. Wees transparant richting je klanten over hoe ze controle kunnen uitoefenen op de gegevens die worden verzameld, inclusief hoe zij zich kunnen afmelden voor tracking of een verzoek kunnen indienen om informatie te verwijderen.

Als goed voorbeeld voor transparantie én focus op privacy van de gebruikers kan de ontwikkeling van de Nederlandse CoronaMelder worden genoemd. Het is ook interessant om te volgen hoe bij de ontwikkeling van de nieuwe CoronaCheck wordt gecommuniceerd over het gebruik van persoonsgegevens. En waarom het voor gebruikers relevant is om die gegevens te verstrekken.
Om te voorkomen dat de klantgegevens op straat komen te liggen, moet de IT-beveiliging op orde zijn. Dat betekent niet alleen bescherming tegen aanvallen van buitenaf, maar ook een degelijk identiteits- en toegangsbeheer. De recente lek bij autobranche-automatiseerder RDC is bijvoorbeeld het gevolg van intern falen.

Ethisch omgaan met AI (KI)

In de discussie rondom ethisch omgaan met data, is kunstmatige intelligentie een onderwerp van gesprek. Twee jaar geleden presenteerde een door de Europese Commissie aangestelde groep van experts Ethische Richtlijnen voor Betrouwbare KI. Bij het grote publiek bestaat er nog veel onduidelijkheid over het nut en de betekenis van Artificial Intelligence. Onthullingen over onverantwoord omgaan met AI algoritmen (zoals recent bij Facebook) dragen niet bij aan het vertrouwen.

Hoe het wel kan, laat Salesforce zien: het bedrijf dat CRM-bedrijfssoftware levert, heeft een aparte afdeling Ethiek en Menselijk Gebruik, met een heuse Chief of Ethics and Humane Use.

Lees ook: