Big data is momenteel hot. En dus slaan bedrijven in razend tempo zoveel mogelijk gegevens op. De uitdaging die volgt: al die data vertalen en effectief inzetten.
We leven in het datatijdperk. Iedere dag komt er gemiddeld 2,5 exabytes aan nieuwe data beschikbaar (dat zijn samen 2.900.000.000.000.000.000 bytes). Er is nu op het web per seconde meer data voorhanden dan er 20 jaar geleden in een heel jaar werd geproduceerd. En die data komt overal vandaan. Van mobieltjes, computerkasten, GPS-signalen en tablets tot en met koelkasten, auto’s en thermostaten die aan het web verbonden zijn. Een gemiddeld mens in de westerse wereld krijgt op één dag meer informatie te verwerken dan zijn verre voorouders uit de prehistorie tijdens hun hele bestaan.
Tailormade aanbiedingen
Nu veel bedrijven hun tools voor het verzamelen van big data op orde hebben gebracht, moeten ze met de gegevens aan de slag. De zoek- en aankoopgeschiedenis van een klant in kaart brengen heeft immers geen enkele waarde, als je vervolgens niet in staat blijkt om hem een tailormade aanbieding te doen. En wat zegt een verzuim van 6 procent als je niet weet op welke afdeling de collega’s werken die het vaakst ziek zijn? In de praktijk worden veel beslissingen echter nog steeds op onderbuikgevoel genomen. Er zijn dan te weinig specialisten beschikbaar die raad weten met die enorme berg aan data.
Gelijktrekken van gegevens
Gegenereerde data echt meerwaarde laten opleveren, begint met het bepalen waar je al die informatie voor nodig hebt. Het antwoord op die vraag leidt al snel tot het afbakenen van de dataset. Gegevens die weinig tot niks toevoegen hoef je immers niet te analyseren. Maar let wel: de data die is verzameld komt vaak uit verschillende bronnen en is doorgaans niet op dezelfde manier opgebouwd. Data uit systeem A heeft dan een andere indeling dan die uit systeem B. Eerst gelijktrekken die handel, voordat je appels met peren gaat vergelijken.
Groeperen en waarden bepalen
De volgende stap is het groeperen en aggregeren van de data. Is er bijvoorbeeld sprake van veel verschillende producten? Dan is het handig om die samen te vatten in productgroepen. Zo houd je tenminste het overzicht. Stel nu de gewenste waarden vast. Wanneer is het resultaat goed, matig of ronduit slecht? De laatste stap in dit proces is het informeren van de eindgebruikers. Iets dat nog wel eens over het hoofd wordt gezien. Print, mail, presenteer en deel de resultaten. Grafieken zijn daarbij duidelijker dan eindeloos veel getallen in onoverzichtelijke tabellen.
Voorbeeld van ziekteverzuim
Laten we bovenstaande stappen eens concretiseren met een voorbeeld. Stel, je hebt een lijst met alle ziektemeldingen van het afgelopen jaar. Je berekent aan de hand daarvan dat het ziekteverzuim op 8 procent ligt. Veel te hoog, zullen de meeste managers meteen roepen. Maar dat kun je eigenlijk pas stellen als je ook weet waar je naartoe wilt. Dit geldt trouwens bij het analyseren van alle soort bedrijfsdata, van het conversiepercentage, de current ratio en het personeelsverloop tot en met de doorlooptijd van offertes en declarabelheid van medewerkers. Oordelen kan pas als je hebt vastgesteld wat de gewenste waarde is.
Stel dat in dit praktijkvoorbeeld het ziekteverzuim naar 4 procent moet. Dan is het een kwestie van inzoomen op de oorzaken. Ook hierbij biedt data de helpende hand, mits die goed gecategoriseerd zijn. Door het ziekteverzuim per afdeling in kaart te brengen, kom je erachter of één specifieke afdeling er slecht uitkomt. Met die informatie ben je alweer een stap dichterbij de oorzaak en de oplossing van het probleem.
Een continu proces
Data analyseren is voor veel organisaties nog geen common good en mede daarom gaat het in de praktijk ook nog wel eens mis. Zo kan het technische plaatje misschien wel kloppen, als medewerkers die het moeten gebruiken er weinig van begrijpen of twijfelen aan het waarheidsgehalte, dan heeft het weinig zin. Daar komt bij dat data analyseren een continu proces is. De behoefte aan informatie verandert immers voortdurend. En vaak nog sneller dan je in eerste instantie denkt.
Meer weten over dit onderwerp? Bezoek de site van ForecastXL.