De komende jaren zullen Big Data steeds belangrijker worden en de vraag naar data-experts zal flink stijgen, volgens marktonderzoeksbureau IDC. Toch is het een vage term, aldus Rommert Dekker: ‘De belangrijkste misvatting over Big Data is dat die automatisch leiden tot nieuwe inzichten. Niet altijd is even helder wat Big Data nu ‘big’ maakt. Het gaat er immers om wat je ermee doet. Vaak kun je volstaan met de juiste data.’
Dekker is academisch directeur van de postacademische opleiding ‘Data & Business Analytics’ van Erasmus Q-Intelligence. Erasmus Q-Intelligence is dienstverlener op het
gebied van onderzoek en onderwijs en verbonden aan het Econometrisch Instituut van de Erasmus Universiteit. De opleiding is bedoeld voor IT’ers, economen, bedrijfskundigen, bestuurskundigen en analisten die affiniteit hebben met kwantitatief onderzoek. Dekker: ‘Overheden en bedrijfsleven zouden veel meer profijt kunnen hebben van inzichten uit Big Data. Helaas ontberen hun mensen vaak de technische vaardigheden.’
‘Sensoren verzamelen data elektronisch. De opslag is veel goedkoper geworden en via internet kunnen we makkelijker delen. Dat leidt tot een tsunami aan data. Die zijn echter nooit perfect. Data moeten worden geschoond op verbanden die nergens op slaan. Noodzakelijk is de technische kennis over de verzameling van data, om zo de bruikbare stukjes informatie eruit te vissen.’
En dat is nog niet alles: ‘Het stappenplan is: van data, naar informatie, naar wijsheid. De informatie uit data moet in verband worden gebracht met de context, en worden gecombineerd met andere inzichten. Pas dan kun je er wat mee in vraagstukken. In zowel het bedrijfsleven als de overheid worstelt men daar enorm mee. Volgens mij zijn veel beslissingen nog steeds gewoon nattevingerwerk. Maar waar weinig worden ondersteund door cijfermatige informatie. Door op de juiste manier met Big Data om te gaan, wordt inzichtelijker waar je moet investeren, hoe je de vraag kan sturen en welke diensten op maat je kunt bieden.’
Forecasting
Er bestaan verschillende technieken voor het omzetten van informatie naar inzichten en die kunnen worden gebruikt voor beleid of bedrijfsvoering. ‘Forecasting’ is daar een van: het doen van voorspellingen op basis van historische data. Dekker legt uit: ‘Het is meer dan het simpelweg doortrekken van een lijntje van een grafiek. Een voorbeeld: in Griekenland verkoopt men al jaren steeds minder koelkasten. We wilden het marktpotentieel in 2025 voorspellen. Als we de trend doortrokken, kwamen we op nul uit. Maar een koelkast is een primaire levensbehoefte, dus dat kan natuurlijk niet kloppen. Je moet er dan data-gedreven modellen op loslaten die onderliggende mechanismes meenemen, zoals een economische crisis. Daarvoor moet je beschikken over kennis van de werking van een model, weten welke factoren de werking beïnvloeden en hoe je daarvoor corrigeert.’
Big data-analyse gaat echter niet puur en alleen over het voorspellen van de toekomst. De techniek ‘prescriptive analytics’ biedt data-gedreven inzichten in de effecten van beslissingen. Het kan laten zien welke opties ‘t meest bijdragen aan het bereiken van een doel. ‘Je ziet dat bijvoorbeeld bij grote sets van data waar men niet zoveel gevoel bij heeft. Met data-gedreven simulatie en optimalisatie kun je veel gerichter beslissingen maken voor allerlei praktische vraagstukken. Sport analytics bijvoorbeeld, is enorm in opkomst. Mensen gingen hockeywedstrijden coderen: persoon A neemt de bal perfect aan, persoon B doet een mooie pass… Als je dat heel erg vaak doet, kun je analyseren wat je sterke en zwakke punten zijn en daarop trainen. Wij hebben vergelijkbare modellen ingezet bij grote bedrijven: welke projecten dragen het meeste bij aan je doelstelling?’
Kunstmatige intelligentie
Een andere toepassing die sterk in opkomst is, is kunstmatige intelligentie, oftewel: ‘machine learning’. Op basis van duizenden kenmerken leren machines als het ware wat de juiste beslissing is. ‘Gezichtsherkenning werkt bijvoorbeeld op die manier: wanneer je een systeem steeds vertelt bij welke kenmerken het een gezicht goed of fout herkent, leert het automatisch welke patronen cruciaal zijn voor goede herkenning. Dit wordt ook gebruikt in de gezondheidszorg, bijvoorbeeld bij het opsporen van tumoren. Maar ook bij het bepalen van de huizenprijs. Ook hier is het aantal kenmerken zó groot dat we dat niet zelf kunnen vinden.
De bovengenoemde technieken vergen kennis over het programmeren van modellen. En zulke kennis hebben beslissers hard nodig bij het gericht maken van beleid of bedrijfsvoering. Dekker stelt: ‘We zien een enorm gat. Mensen met de technische vaardigheden kunnen vaak geen business case maken. En mensen die dat wel heel goed kunnen, ontberen vaak de technische achtergrond om modellen te programmeren en data goed te interpreteren. Het komt maar bij weinig opleidingen beide aan de orde terwijl het zo belangrijk dat die scheidslijn verdwijnt. En communicatie is minstens zo belangrijk. Zowel techneuten als beslissers moeten over de tools beschikken om ontdekte verbanden te visualiseren en zo inzichtelijk en begrijpelijk te maken.’
Wil je meer weten over dit onderwerp? Meld je dan aan voor de opleiding Data Analytics for Management.