Winkelmand

Geen producten in je winkelwagen.

Gegevens terugvinden in de databerg: hoe deel je bestanden?

De hoeveelheid data groeit exponentieel. En door de digitalisering van papier lijkt daar nog geen einde aan te komen. Hoe kunnen we bestanden terugvinden en delen in een groeiende databerg?

De belangrijkste uitdaging voor bedrijven om de berg aan files te beklimmen blijft het terugvinden van die gegevens. 2,5 triljoen bytes wordt er per dag aan informatie geproduceerd. Dat is data van 530.000.000 miljoen liedjes, 150.00.000 iPhones, 5 miljoen laptops en 90 jaren aan HD video, zo becijferde data-analytics spin-off Level van de Northeastern University. Die stapel aan bytes groeit, en steeds sneller. Het overgrote deel van de digitale gegevens – ongeveer 90 procent – is de afgelopen twee jaar gefabriceerd, aldus IT-multinational IBM. Het resultaat, zegt analistenbureau IDC, is dat we in 2020 al meer dan 44 biljoen gigabytes aan data hebben. Het merendeel daarvan wordt nu nog in de westerse landen gegenereerd. Dat zal in 2020 veranderen, als de landen in ontwikkeling de grootste producenten worden van digitale data. En ook het Internet-of-Things draagt bij aan de groei van de hoeveelheid digitale gegevens; data van embedded systemen zal groeien van 2 procent in 2013 naar 10 procent in 2020. Geen papierloos kantoor Maar organisaties hebben niet alleen met digitale data te maken. Hoewel het Amerikaanse BusinessWeek in 1975 nog het papierloze kantoor voorspelde, werkte 34 jaar later, in 2009, nog geen vijfde van de bedrijven papierloos, aldus onderzoek van AIIM. En nog steeds is papier populair. Uit de Papierloos Werken Monitor van 2015 blijkt dat Nederlanders per dag nog gemiddeld 16,1 velletjes papier uit de printer laten rollen. Kenniswerkers zijn nu eenmaal dol op papier, blijkt uit onderzoeken. Meer dan de helft (56 procent) van de onderzochte organisaties geeft de voorkeur aan papieren contracten en bestel- en reserveringsformulieren. Veertig procent houdt behoefte aan getekende en beveiligd bewaarde papieren en waardedocumenten. Gevolg: bij digitaliseringsprojecten wordt niet over aantallen documenten gesproken, maar over de hoeveelheid kilometers. Toenmalig minister Ronald Plasterk van Binnenlandse Zaken schreef in 2009 aan de regering dat de schatting is dat de Rijksdienst 800 strekkende kilometer papieren en andersoortig archief heeft. De Faculteit der Maatschappij- en Gedragswetenschappen van de Universiteit van Amsterdam inventariseerde aan het begin van een digitaliseringproject 8 kilometer papier. Iron Mountain, dat archieven van klanten beheert, berekende in 2015 dat het wereldwijd op ongeveer 1100 locaties 160.000 strekkende kilometer papier beheert - vier keer rond de evenaar in A4-tjes. Data zorgt voor uitdagingen Gelukkig, schrijft IDC, is een groot deel van de digitale data vergankelijk – denk aan onopgeslagen Netflixdata, Xbox One interacties of tijdelijke routing informatie tussen netwerken. ‘Dit is een goede ontwikkeling, want de beschikbare opslagcapaciteit (ook wel ongebruikte bytes genoemd) groeit minder hard dan het digitale universum. In 2013 was er slechts genoeg opslagcapaciteit voor 33 procent van het digitale universum. In 2020, kan er nog maar 15 procent worden opgeslagen’, aldus de onderzoekers. Het opslaan van al die data is een van de grotere zorgen van organisaties; 88% van de IT-managers ondervindt problemen om de groei van en vraag naar dataopslag bij te blijven. 84% vindt dat de kosten voor dataopslag uit de hand loopt, blijkt uit onderzoek van IT-leverancier Freeform Dynamics. Vindbaarheid: bestanden delen De vindbaarheid is een ander punt dat zorgen baart. Een groot deel van de IT-managers (82 procent) in middelgrote organisaties denkt dat besluitvorming wordt bemoeilijkt door gebrekkige beschikbaarheid en inconsistentie van gegevens. Classificatie van de documenten kan die vindbaarheid vergroten, evenals het beter deelbaar maken van bestanden door collaboratie tools zoals bijvoorbeeld Dropbox. Bedrijven zijn hiermee bezig en zo worden ook de mogelijkheden voor analyses vergroot. In 2013 was 22 procent van de digitale informatie klaar voor analyse, de verwachting is dat dit in 2020 35 procent zal zijn. Door digitalisering van papier is er misschien wel meer mogelijk met data – betere vindbaarheid of analyses – maar tegen de verwachting in lost dit het probleem van de groei van papier niet op. Directeur Jeroen Strik van Iron Mountain: ‘Daarnaast zien we dat ook als organisaties digitaal gaan werken die papieren wereld blijft bestaan, omdat het vaak te kostbaar is om de geschiedenis van een klant – bijvoorbeeld bij een ziekenhuis – in te scannen. Voor de kosten van het digitaliseren kun je het namelijk vaak goedkoper 30 tot 35 jaar fysiek opslaan.’
Je leest nu: Gegevens terugvinden in de databerg: hoe deel je bestanden?

De belangrijkste uitdaging voor bedrijven om de berg aan files te beklimmen blijft het terugvinden van die gegevens. 2,5 triljoen bytes wordt er per dag aan informatie geproduceerd. Dat is data van 530.000.000 miljoen liedjes, 150.00.000 iPhones, 5 miljoen laptops en 90 jaren aan HD video, zo becijferde data-analytics spin-off Level van de Northeastern University. Die stapel aan bytes groeit, en steeds sneller. Het overgrote deel van de digitale gegevens – ongeveer 90 procent – is de afgelopen twee jaar gefabriceerd, aldus IT-multinational IBM.

Het resultaat, zegt analistenbureau IDC, is dat we in 2020 al meer dan 44 biljoen gigabytes aan data hebben. Het merendeel daarvan wordt nu nog in de westerse landen gegenereerd. Dat zal in 2020 veranderen, als de landen in ontwikkeling de grootste producenten worden van digitale data. En ook het Internet-of-Things draagt bij aan de groei van de hoeveelheid digitale gegevens; data van embedded systemen zal groeien van 2 procent in 2013 naar 10 procent in 2020.

Geen papierloos kantoor

Maar organisaties hebben niet alleen met digitale data te maken. Hoewel het Amerikaanse BusinessWeek in 1975 nog het papierloze kantoor voorspelde, werkte 34 jaar later, in 2009, nog geen vijfde van de bedrijven papierloos, aldus onderzoek van AIIM. En nog steeds is papier populair. Uit de Papierloos Werken Monitor van 2015 blijkt dat Nederlanders per dag nog gemiddeld 16,1 velletjes papier uit de printer laten rollen.

Kenniswerkers zijn nu eenmaal dol op papier, blijkt uit onderzoeken. Meer dan de helft (56 procent) van de onderzochte organisaties geeft de voorkeur aan papieren contracten en bestel- en reserveringsformulieren. Veertig procent houdt behoefte aan getekende en beveiligd bewaarde papieren en waardedocumenten.

Gevolg: bij digitaliseringsprojecten wordt niet over aantallen documenten gesproken, maar over de hoeveelheid kilometers. Toenmalig minister Ronald Plasterk van Binnenlandse Zaken schreef in 2009 aan de regering dat de schatting is dat de Rijksdienst 800 strekkende kilometer papieren en andersoortig archief heeft. De Faculteit der Maatschappij- en Gedragswetenschappen van de Universiteit van Amsterdam inventariseerde aan het begin van een digitaliseringproject 8 kilometer papier. Iron Mountain, dat archieven van klanten beheert, berekende in 2015 dat het wereldwijd op ongeveer 1100 locaties 160.000 strekkende kilometer papier beheert – vier keer rond de evenaar in A4-tjes.

Data zorgt voor uitdagingen

Gelukkig, schrijft IDC, is een groot deel van de digitale data vergankelijk – denk aan onopgeslagen Netflixdata, Xbox One interacties of tijdelijke routing informatie tussen netwerken. ‘Dit is een goede ontwikkeling, want de beschikbare opslagcapaciteit (ook wel ongebruikte bytes genoemd) groeit minder hard dan het digitale universum. In 2013 was er slechts genoeg opslagcapaciteit voor 33 procent van het digitale universum. In 2020, kan er nog maar 15 procent worden opgeslagen’, aldus de onderzoekers.

Het opslaan van al die data is een van de grotere zorgen van organisaties; 88 procent van de IT-managers ondervindt problemen om de groei van en vraag naar dataopslag bij te blijven. 84 procent vindt dat de kosten voor dataopslag uit de hand loopt, blijkt uit onderzoek van IT-leverancier Freeform Dynamics.

Vindbaarheid: bestanden delen

De vindbaarheid is een ander punt dat zorgen baart. Een groot deel van de IT-managers (82 procent) in middelgrote organisaties denkt dat besluitvorming wordt bemoeilijkt door gebrekkige beschikbaarheid en inconsistentie van gegevens. Classificatie van de documenten kan die vindbaarheid vergroten, evenals het beter deelbaar maken van bestanden door collaboratie tools zoals bijvoorbeeld Dropbox. Bedrijven zijn hiermee bezig en zo worden ook de mogelijkheden voor analyses vergroot. In 2013 was 22 procent van de digitale informatie klaar voor analyse, de verwachting is dat dit in 2020 35 procent zal zijn.

Door digitalisering van papier is er misschien wel meer mogelijk met data – betere vindbaarheid of analyses – maar tegen de verwachting in lost dit het probleem van de groei van papier niet op. Directeur Jeroen Strik van Iron Mountain: ‘Daarnaast zien we dat ook als organisaties digitaal gaan werken die papieren wereld blijft bestaan, omdat het vaak te kostbaar is om de geschiedenis van een klant – bijvoorbeeld bij een ziekenhuis – in te scannen. Voor de kosten van het digitaliseren kun je het namelijk vaak goedkoper 30 tot 35 jaar fysiek opslaan.’