Winkelmand

Geen producten in de winkelwagen.

4 domme vragen over big data

De belofte van Big Data is groot, hoor je overal om je heen. Maar wat is het eigenlijk, wat kun je ermee, en: moeten we er ook niet een beetje bang voor zijn? Vier domme vragen.
 

> Big Data, hetzelfde als business intelligence?

Ja en nee. Big Data is een containerbegrip voor de enorme berg aan beschikbare digitale gegevens. Plus de belofte dat je uit deze berg allerlei waardevolle informatie kunt halen. Voorheen werd dat 'datamining' of KDD (knowledge discovery in databases) genoemd, en de eruit voortkomende kennis 'business intelligence'. Wordt deze kennis gebruikt om toekomstige ontwikkelingen te voorspellen, dan spreek je van predictive analytics.

Datamining en business intelligence waren ooit een hype, maar de resultaten van de specialistische systemen vielen vaak tegen. Nu de databergen van ­bedrijven exponentieel groeien, is Big Data de nieuwe vlag waaronder de ict-sector zichzelf heeft verenigd.
Die datagroei is indrukwekkend. Twintig jaar geleden was praten over terabytes, oftewel 1.000 gigabyte aan informatie, als praten over tijdreizen. Nu is het de gewoonste zaak van de wereld. YouTube verwerkt elke minuut 48 uur aan videomateriaal, Twitter meer dan een half miljard berichtjes per dag. En het bedrijfsleven doet vrolijk mee. Supermarktketen WalMart voegt elk uur ruim 1 miljoen klanttransacties toe aan een database met nu al ruim 2,5 petabyte aan gegevens, omgerekend een 4,5 kilometer hoge toren aan cd-romschijfjes.

Volgens marktonderzoeker IDC genereert de wereld dit jaar 2.700 exabytes aan digitale informatie, oftewel 2.700 miljard gigabyte, een hoeveelheid die jaarlijks met zo’n 60 procent groeit. Opslagmogelijkheden groeien zo snel dat bewaren nu goedkoper is dan verwijderen. De uitdaging is om uit die enorme brij aan informatie waardevolle patronen te destilleren. Koren op de molen van softwarereuzen als Oracle, IBM, SAP, Exact en Microsoft, dat hiervoor onlangs een nauwe samenwerking met Logica bekendmaakte. Ruwe datastromen ­managen en analyseren vormt een markt die momenteel zo’n 150 miljard dollar waard is, schat IBM. In 2015 moet dat 208 miljard dollar zijn.

> Klinkt groots. Maar wat kun je er eigenlijk mee?

“Inefficiënties of zwakke punten in productieprocessen signaleren”, stelt Edo Roos Lindgreen, UvA-hoogleraar IT & Auditing en partner bij KPMG. “En dat kan leiden tot besparing, risicobeperking en winstoptimalisatie.” Volgens het McKinsey Global Institute zou de Amerikaanse gezondheidszorg zo een besparing van 300 miljard kunnen realiseren, terwijl de omzet van retailers met liefst 60 procent zou kunnen stijgen. De trend gaat van controle achteraf naar het voorspellen van de toekomst. Door analyse van duizenden websites, blogs en sociale netwerken voorzag Google Trends bijvoorbeeld zeer accuraat het verloop van de vogelgriep en de Amerikaanse presidentsverkiezingen.

Hal Varian, befaamd hoofdeconoom van Google, verwacht ‘revolutionaire veranderingen op economie- en marketing­gebied’ door dit soort voorspellende gegevens. “Mensen hebben vaak ideeën en voorgevoelens over de toekomst”, stelt de voormalig hoogleraar informatie-economie. “Maar als je eenmaal data hebt, kun je voorspellingen toetsen en goed onderbouwde toekomstbeslissingen nemen.”

Wie dat kunstje beheerst, kan de concurrentie ver achter zich laten, blijkt uit het recente onderzoeksrapport Big Data: Harnessing a game-changing asset van de Economist Intelligence Unit. De waarde van beschikbare data binnen een bedrijf, inmiddels data equity gedoopt, stijgt hard. Niet gek dus dat uit recent onderzoek van de Erasmus Universiteit en PwC blijkt dat 6 op 10 professionele analisten en beleggers meer inzicht willen in de waarde ervan. Financiële rapportages zouden op die behoefte moeten worden aangepast, stellen zij dan ook.

> Waarom merken we er nog zo weinig van?

Computerfabrikanten, softwareleveranciers, investmentbankers en adviesbureaus tuimelen over elkaar heen met onderzoeken en white papers waarin de vele zegeningen van Big Data worden ­bewierookt. Diezelfde partijen waarschuwen echter luidkeels voor de vele valkuilen op weg naar het datawalhalla. In januari 2012 rapporteerde Gartner nog dat grote organisaties zowel op technisch als op managementgebied ernstig tekortschieten. Volgens de voorspellingen van de technologieonderzoeker lukt het liefst 85 procent van de Fortune 500-­organisaties tot 2015 niet om ‘Big Data effectief aan te wenden als competitief voordeel’. Gegevens verzamelen en analyseren is namelijk niet genoeg; de datastromen moeten ook op de juiste tijd de juiste conclusies genereren.

Vaak gaat het echter vaak al fout aan de basis, constateert Roos Lindgreen. “Zelfs de master data, met gegevens over de pijlers van het bedrijf, is vaak al flink vervuild.” Alleen het samenbrengen van beschikbare data uit separate bedrijfs­afdelingen, computersystemen en media blijkt vaak al een grote uitdaging. Soms zijn die data gestructureerd, meestal niet. Experts schatten dat die ­ongestructureerde categorie, waartoe bijvoorbeeld e-mails, documenten en informatie uit social media behoren, goed is voor tenminste 80 procent van alle beschikbare data.

De échte uitdaging is dus al die verschillende data samen te smelten tot één steekhoudend verhaal, oftewel one single version of the truth. Volgens het McKinsey Global Institute groeit het tekort aan mensen met de juiste vaardigheden hiervoor met de dag. In 2018 zou deze specifieke talent gap al 140.000 tot 190.000 personen bedragen. En dan ­missen we ook nog eens 1,5 miljoen managers die ermee om kunnen gaan. “Data-analisten vinden is een heuse wapenwedloop”, aldus Andreas Weigend, de voormalige wetenschapschef van webwinkel Amazon. “Mathematicians are suddenly sexy.”

> En hoe zit het dan met onze privacy?

Goed punt. Het Rathenau-instituut constateerde jaren geleden al dat een Nederlander al snel in 500 verschillende databases staat. Nu steeds meer verschillende databronnen (kunnen) worden samengevoegd, is van de meesten van ons een angstig gedetailleerde digitale schaduw te produceren. Zorgwekkend, stelt privacyadviseur John Borking, die jarenlang als vicevoorzitter van de Registratiekamer (de voorloper van het College Bescherming Persoonsgegevens) bovenop het probleem zat. Hij zegt dat databasebeveiliging bij veel overheden en bedrijven “nadrukkelijk niet als prioriteit wordt ervaren”. Die conclusie onderschrijft onderzoeker Forrester in het recente rapport The Future Of Data Security And Privacy: Controling Big Data.

Bijkomend probleem is dat de processen die deze metagegevens genereren steeds vaker volledig geautomatiseerd zijn. Het Rathenau-instituut vreest ‘verregaande consequenties’: “Klanten over wie bedrijven gegevens verzamelen kunnen door een toevallige match van gegevens uitgesloten worden van een bepaalde dienstverlening, zoals een verzekering, of daarvoor een hogere premie moeten betalen. Het wettelijk inzage- en correctierecht blijft vaak een papieren recht, dat zich moeilijk laat effectueren. Fouten in de gegevensverzameling en verwerking laten zich dan moeilijk herstellen.”

Hoeveel bytes is…?

1 kB (kilobyte) = 1.000 bytes
1 MB (megabyte) = 1.000.000 bytes
1 GB (gigabyte) = 1.000.000.000 bytes
1 TB (terabyte) =   10 tot de 12de macht aan bytes 

1 PB (petabyte) = 10  tot de 15de macht aan bytes

1 EB (exabyte) = 10 tot de 18de macht aan bytes
1 ZB (zettabyte) = 10 tot de 21ste aan bytes
1 YB (yottabyte) = 10 tot de 24ste aan bytes

Dagelijks de nieuwsbrief van Management & Leiderschap ontvangen?



Door je in te schrijven ga je akkoord met de algemene en privacyvoorwaarden.

Een gigabyte komt ongeveer overeen met de tekst uit 50 boekenplanken vol romans, of anderhalf keer de informatie op een cd-rom. Omdat de byte-eenheid eigenlijk teruggaat op machten van 2, en 1 KB eigenlijk 1.024 bytes is, is er ook een (correctere) binaire vorm van deze eenheden: kibibyte, mebibyte, gibibyte, en zo verder. Hoe het ook mag ­heten, yobibyte of yottabyte, veel is het. 

 

Lees ook: