Data-governance is het beleid dat wordt gevoerd op gegevensverwerking om er zorg voor te dragen dat de gegevens betrouwbaar en bruikbaar zijn en blijven. Om dat vast te stellen zijn zes fundamentele data-eigenschappen van belang:
- Volledigheid: Hoe compleet zijn de gegevens?
- Nauwkeurigheid: Hoe accuraat zijn de gegevensbronnen?
- Conformiteit: Hoe consistent of uniform zijn de gegevens?
- Geldigheid: Hoe controleerbaar is de juistheid van gegevens?
- Uniciteit: Is de data origineel; zijn er geen duplicaten of overlap?
- Integriteit: Wat is de oorsprong van data en worden gegevens correct verwerkt?
Garbage in, garbage out
Om deze zes data-dimensies doorlopend te monitoren en evalueren is beleid en controle nodig. Het doel van data-governance is om ervoor te zorgen dat gegevens die gebruikt worden voor het realiseren van bedrijfsdoelen daar ook geschikt voor zijn. Wat gegevens betreft, geldt het ICT-adagium: “garbage in, garbage out”. Als de gebruikte data bijvoorbeeld onnauwkeurig of onvolledig zijn, is de Business Intelligence die daarop is gebaseerd onbetrouwbaar. ‘Garbage out’ is nog een groter probleem met machine learning, omdat er dan geen menselijke handelingen aan te pas komen om problemen met de dataset op te merken.
80/20-regel
Goede data-governance is daarom niet alleen verstandig, het is van kritiek belang voor elke moderne business. In data science geldt nog steeds de 80/20-regel van IBM. Om analytics effectief uit te voeren, gaat 80 procent van de tijd naar het klaarmaken van data, het opschonen van gegevens, uniform maken van datasets, zoeken van gegevens, enzovoorts. De overige 20 procent gaat daadwerkelijk op aan analytics. Dit onderstreept hoe belangrijk data-governance voor het proces is.
Zo verdien je geld aan data
Iedereen heeft data, maar niet iedereen verdient eraan. Dat is zonde want er blijven in Nederland miljarden euro’s op tafel liggen. Hoe verdien je eigenlijk aan data? Dat lees je in het gratis uitgebreide research rapport. Download nu!
lees verderKostenverlaging door goed databeleid
Ook zorgt goed databeleid voor een kostenverlaging. Het corrigeren van dubbele gegevens kost volgens schattingen, gecorrigeerd voor het aantal probleemgevallen in de datasets, al snel tientallen euro’s per dubbeling. Maar voorkomen van duplicaten kost een bedrijf een fractie van die prijs. De inzet van foutieve data kost een bedrijf veel geld omdat er wordt gestuurd op verkeerde aannames. Goede governance draait niet alleen om het creëren van databeleid, maar ook om de monitoring van wat er daadwerkelijk gebeurt tot doorlopende evaluatie van de resultaten en aanpassing van doelen.
Lees ook: Realtime analytics: wat is het en hoe levert het jouw bedrijf geld op?
Tips voor goede datakwaliteit
- Maak iemand verantwoordelijk voor het opschoningsproces (bijvoorbeeld een Chief Data Officer)
- Stel een datakwaliteitsplan op, neem de bedrijfsspecifieke KPI’s daarin op
- Evalueer wekelijks of maandelijks wat er is gebeurd qua opschoning
- Stel een evaluatieteam samen uit meerdere afdelingen, niet alleen informatisering en automatisering
- Maak het agile: verbeteringen moeten direct doorgevoerd kunnen worden
- Monitor de opschoning: treden er fouten op?
Bronnen:
DNB: Wat u moet weten over PSD2
Deloitte: New EU Corporate Sustainability Reporting Directive
FAQ's data-governance en datakwaliteit
Wat zijn de voordelen van governance voor het verdienmodel?
Data-governance zorgt voor goede sturingsinformatie, zodat targets en gedefinieerde KPI’s meetbaar gehaald kunnen worden. Dat leidt tot betere bediening van klanten, competitieve voordelen en een verhoging van de omzet. Daarnaast wordt efficiëntie verbeterd met een goede datakwaliteit en wordt er minder gestuurd op onjuiste aannames. Data-driven werken kan alleen met goede data, want zonder betrouwbare data weet je niet eens dat er verkeerd wordt gestuurd.
Wat zijn de risico’s als je de data-governance niet op orde hebt?
Zonder garanties op de datakwaliteit, loop je ten eerste tegen compliance-problemen aan. Auditors kunnen dan bijvoorbeeld geen assurance afgeven voor een cruciaal onderdeel van de verslaggeving. Dit is vooral belangrijk als een onderneming daartoe wettelijk verplicht is. Daarnaast zijn er financiële en operatingrisico’s als de governance niet op orde is. Zonder databeleid en sturing op datakwaliteit vaart een bedrijf op onbetrouwbare informatie en dus onjuiste conclusies. Dat leidt tot verkeerd ingezette resources, een verlies van productiviteit, gemiste targets en financiële verliezen.
Welke wettelijke verplichtingen zijn er als het gaat om data?
Op nationaal niveau lopen veel bedrijven aan tegen de Algemene Verordening Gegevensbescherming (AVG). Deze treedt in werking zodra er persoonsgegevens worden verwerkt en opgeslagen. Dat gebeurt al heel snel. Daarbij is het onder meer belangrijk dat klanten en eindgebruikers expliciet worden geïnformeerd over de gegevensverwerking, dat er een systeem is dat ze recht geeft op inzage en dat ze recht hebben op verwijdering van gegevens. Afhankelijk van het bedrijf kunnen er ook data-eisen gesteld worden onder de Wwft (financiële data en klantgegevens), de Europese PSD2 (verwerking van financiële transacties), de Amerikaanse SOX (boekhouding), Amerikaanse PCI DSS (bankgegevens), de Europese CSRD (duurzaamheid en ESG-gegevens) en legio andere wetten in regio’s waar multinationals actief zijn. Om juridische problemen en hoge boetes te voorkomen is het zaak om je goed informeren te laten door juristen over welke compliance-eisen van toepassing zijn op je specifieke business zodat je zicht hebt op welke data wordt verzameld en waar dat gebeurt.
Hoe meet je het succes van data-governancebeleid?
De KPI’s die je opstelt voor de datakwaliteit, hangen sterk af van het specifieke bedrijfsdoel. De geldigheid van gegevens is bijvoorbeeld erg belangrijk voor een financieel doel, vooral als datadoelen te maken krijgen met compliance vanuit bijvoorbeeld de Wwft. Conformiteit is dan weer belangrijk voor het snel kunnen gebruiken van data in bepaalde BI-tools, wat voor veel bedrijven een belangrijke drijfveer is om data te analyseren. En met het oog op dataminimalisatie, om bijvoorbeeld alleen specifieke telemetrie of geaggregeerde data op te slaan, is de data-dimensie ‘volledigheid’ wat minder van belang dan ‘nauwkeurigheid’.