Alle informatie die de mensheid in honderdduizenden jaren heeft opgebouwd, verdubbelt de komende drie jaar nog eens in omvang. De opslagmarkt is de enige sector in de IT waar de groei nog flink in zit. Petabytes, exabytes, zetabytes en yotabytes: welkom in de wondere wereld van storage.
Hu Yoshida heeft een oriëntaalse naam, ziet er ook oriëntaals uit, werkt voor een volle dochter van het Japanse Hitachi, maar is een geboren en getogen Amerikaan. Yoshida is chief technology officer (cto) van Hitachi Data Systems (HDS) en specialist in Storage Management. Samen met IBM, Sun, Compaq en EMC houdt HDS de markt voor Storage Management in een stevige houdgreep. EMC leidt de markt met een aandeel van 20 procent, maar HDS groeit sneller dan EMC. Het bedrijf heeft strategische allianties gesloten met Sun en Hewlett-Packard, die de systemen van het bedrijf onder hun naam op de markt brengen.
Voor HDS geldt het opslaan, beheren en toegankelijk maken van de elektronische informatiebrij als de enige reden van zijn bestaan. De cijfers spreken boekdelen: HDS heeft een slordige drieduizend mensen in dienst in 48 landen. Dit jaar wil het bedrijf nog eens zeshonderd nieuwe medewerkers aantrekken. HDS investeert dit jaar 1,2 miljard dollar in r&d. De bedoeling is dat het daarmee de nummer twee positie verwerft in de markt voor Storage Management met te verwachte inkomsten van circa 3 miljard dollar op jaarbasis. In 2000 schreef HDS winstcijfers van 237 miljoen dollar in de boeken, analisten verwachten dat die winst over 2001 meer dan verdubbelt tot 587 miljoen.
Storage Management is big business en niet alleen voor HDS. Analisten adviseren een buy als het om databedrijven zoals HDS gaat. J.P. Morgan geeft zelfs een long-term buy advies specifiek voor Hitachi Data Systems. De groei is afgezwakt, erkent Yoshida. “De rek is er een beetje uit. Maar de inkomsten uit de opslagmarkt toonden in het voorbije fiscale jaar toch nog een groei van 22 procent.” Ook andere cijfers laten een florissant beeld zien. In de tweede helft van 2001 droogde het risicokapitaal voor de modale dotcommers nagenoeg helemaal op. Maar niet voor data storage-bedrijven die alsnog bijna een half miljard dollar vers kapitaal wisten aan te trekken. Een analiste van de Enterprise Storage Group fluisterde de Financial Times recentelijk toe dat storage het enige marktsegment is binnen de IT-sector waar continue groei wordt verwacht, ondanks de kwakkelende economie en de aanvallen van 11 september.
Röntgenfoto
Een van de redenen van deze boom is dat opslag drastisch goedkoper aan het worden is en dus binnen handbereik komt van veel meer bedrijven en individuen dan ooit eerder het geval was. De opslag van 1 gigabyte aan informatie kostte in het najaar van 2000 nog 10 dollar. Voorspeld wordt dat dit in 2005 nog slechts 1 dollar kost. Dat is goed nieuws voor de archivarissen van deze tijd. Want er wordt gigantisch veel informatie geproduceerd. EMC, de grote concurrent van HDS, liet recentelijk een studie uitvoeren door de School of Information Management and Systems (SIMS) van de universiteit van Californië. Daaruit blijkt dat de mensheid in zijn geheel op jaarbasis 1,5 exabytes aan nieuwe informatie produceert. Dat is hetzelfde als 1,5 miljard gigabytes ofwel 250 megabytes voor elke levende mens op aarde.
Als we dit hijgtempo met zijn allen volhouden – en daar ziet het naar uit – dan produceren we de komende drie jaar evenveel informatie als we in de voorbije 300.000 jaren bij elkaar hebben gedaan. Vanwaar die schrikbarende toename? Informatie bestaat niet alleen uit de letters in dit blad en andere gedrukte publicaties. Integendeel! Bedrukt papier (boeken, kranten) legt beslag op niet meer dan een schamele 0,03 procent van de totale datastroom. De onderzoekers van SIMS rekenen ook e-mail, foto's, films en zelfs röntgenfoto's tot onze informatiestroom. Nog geen tien jaar geleden was het grote publiek volstrekt onbekend met het gebruik van e-mail. En hoewel de inhoud van een modaal e-mailtje in termen van luttele kilobytes uitgedrukt kan worden, produceren we vandaag met zijn allen op jaarbasis ruim 11.000 terabytes aan e-mail.
Ook voor Henk van Laar, hoofd operationele uitvoering van de Vereniging van Kamers van Koophandel, is e-mail de ware boosdoener. “Bij IBM in San José stelt men dat de storage per jaar verdubbelt. Dat is ook bij ons het geval. Op jaarbasis. Het is gigantisch. In totaal beheren we 2 terabyte. Dat is 2000 gigabyte. Maar dat is op zich wel normaal. Als je bedenkt dat de meeste bedrijven de laatste jaren volledig met e-mail zijn uitgerust, als je ziet hoe vaak een e-mailtje rondgaat en wordt opgeslagen, dat veroorzaakt een enorme groei. En dan heb ik het nog niet over de reguliere zaken. Wij voeren het handelsregister voor de kamers, dat bestand is alleen al ongeveer 100 gigabyte groot.”
Shakespeare
Er is nog meer vergelijkingsmateriaal dat de toename aan data kan verklaren. De zaterdagkrant neemt in digitale vorm niet veel meer dan ongeveer 1 Mb in beslag. Maar de opslagruimte van één niet-gecomprimeerde foto is even groot. De verzamelde werken van William Shakespeare zijn goed voor circa 5,5 Mb, terwijl de resultaten van één enkel hersenonderzoek uitgevoerd met een scanner 3,9 Mb aan opslag vraagt.
Niet alleen produceren we kennelijk veel meer informatie dan ooit tevoren, de informatie zelf is ook veel logger in omvang. Ook produceren we heel veel informatie over de informatie die we verzamelen en we maken daar bovenop nog eens kopieën van die informatie voor de broodnodige back-up. De economische angst dat er een snipper informatie verloren zou kunnen gaan, speelt een cruciale rol in het bedrijfsleven van vandaag.
Yoshida ziet ook economisch voordeel in die hamsterzucht. “Als je in een hotel logeert, wordt er een verslag bijgehouden van je gedrag. Als je vliegt, wordt er informatie verzameld over jou als frequent flyer. De informatiestroom is een lawine die niet meer te stoppen is. Bedrijven halen daar voordeel uit. Ze kunnen hun dienstverlening verbeteren. Nog niet zo heel lang geleden staken we al een vreugdevuur aan als we over één terabyte konden onderhandelen met een klant. Het is voor ons al lang niet meer ongewoon om over honderden terabytes te onderhandelen. Recentelijk hebben we al een paar petabyte-deals gesloten. Dan praten we over duizend terabytes!”
De moderne archivaris rukt onmiskenbaar op in de richting van de zogenaamde netwerkopslag. In het jargon van de branche staan twee begrippen naast elkaar: storage area networks of san versus network attached storage of nas (zie kader 'san en nas'). Simpel gezegd wordt er bij nas gewoon een nieuwe server aan het netwerk gehangen om die met de broodnodige opslagcapaciteit uit te breiden. Een nas is een vrij simpele oplossing en relatief goedkoop. Een san daarentegen is een veel ingewikkelder verhaal, veel duurder ook, maar biedt vooral meer mogelijkheden. Een san werkt met een vaste glasvezelverbinding die tussen de verschillende opslagsystemen van een bedrijf ligt. Als bij wijze van spreken de Amsterdamse harde schijven vollopen, dan kunnen die uit Maastricht of Eindhoven extra capaciteit aanleveren. Zo komt de opslagcapaciteit van het hele bedrijf beschikbaar. Volgens Yoshida hebben sans de toekomst. “De meeste systemen maken gebruik van niet meer dan 50 procent van hun eigen opslagcapaciteit. De rest wordt domweg niet gebruikt. Die capaciteit kan alsnog worden benut.” De schijfruimte van de verschillende pc's die aan het netwerk gekoppeld zijn, kan door middel van het san onderling verbonden worden om als het ware één grote virtuele harde schijf neer te zetten, een zogenaamde virtual pool. Daardoor kunnen bedrijven de kosten drukken.
Teller
Een beetje san kan bedrijven echter ook flink op kosten jagen. Het concept van een san voorziet immers in het gebruik van glasvezel. En glasvezel is duur. Daarnaast moeten er switches en adapters worden aangeschaft, het beheer van het san moet geregeld worden. Inderdaad een interessante groeimarkt, vooral voor de IT-bedrijven dan.
Volgens onderzoeksbureau IDC groeit de markt voor sans met 64 procent op jaarbasis. Yoshida maakte naar eigen zeggen een verdriedubbeling mee, alleen al in de laatste twee kwartalen van vorig jaar. Niet alleen groeit de opslagcapaciteit van bedrijven dramatisch, ook de toegangssnelheid tot de dataopslag blijft gestaag groeien. Yoshida: “Ebay beschikt over een opslagcapaciteit van ongeveer 12 tot 16 terabytes. Dat is niet eens zo heel erg veel volgens de huidige normen. Maar die relatief geringe omvang is voorlopig toch voldoende, omdat Ebay constant oude, verkochte producten afvoert. Het toevoegen van nieuwe producten is het probleem niet. Bij Ebay is niet zozeer de omvang van de datastroom van belang, maar de toegang ertoe. Die is gigantisch gegroeid. Daarom willen we systemen bouwen die een dergelijke groei aankunnen. Het belangrijkste probleem van dataopslag is bandbreedte.”
Daar komt bij dat de vraag naar opslagcapaciteit moeilijk te voorspellen is in de internetwereld, meent Yoshida. “Je kunt plotseling succes hebben met een bepaalde advertentie, waardoor je overspoeld wordt door gebruikers. Dan zit je met een onverwachte en onmiddellijke behoefte aan extra capaciteit.” HDS verpacht om die reden ook storage on demand. Een klant koopt bijvoorbeeld 100 Gigabyte in, maar weet zich verzekerd van een extra 10 Gigabyte die bij HDS klaar ligt om onverwachte capaciteitsproblemen op te vangen. “We kunnen zien wanneer de klant er gebruik van maakt en dat factureren we dan. Als de extra ruimte niet langer in gebruik is, wordt de teller stopgezet. De klant weet dat opslag goedkoper wordt, die wil hij niet vooruit hoeven kopen. Morgen is die harde schijf toch weer een stuk goedkoper. Het stelt de klant in staat slechts te kopen wat hij vandaag nodig heeft.”
De goedkoopste oplossing van het opslagprobleem is voor bedrijven echter het veranderen van het gedrag van de medewerkers. Alleen zijn er weinig systeembeheerder die zich de ergernis van hun collega's op de hals willen halen door ze er voortdurend aan te herinneren dat ze hun e-mailbak eens moeten leegmaken. Dan toch maar liever een server erbij. De IT-branche zal het niet erg vinden.
Datastroom verdubbelt in enkele jaren tijd
Hoeveel besteden Nederlandse bedrijven gemiddeld aan Storage als percentage van het volledige IT-budget? Volgens de Nederlandse marktvorser Heliview gaat het om circa 5000 euro op jaarbasis, dat is ongeveer 33 procent van de jaarlijkse IT-uitgaven. Het gebruik van specifieke servers voor opslag komt reeds bij 61 procent van de bedrijven in Nederland voor. Die bedrijven beschikken over meer dan vijfhonderd geautomatiseerde werkplekken. Dat houdt in dat 83.000 vestigingen van bedrijven in Nederland met de problematiek van storage geconfronteerd worden. Een aantal factoren veroorzaakt de enorme groei in data, zoals het feit dat het aantal organisaties dat wordt geautomatiseerd nog steeds groeit. Ook de intensiteit waarmee die organisaties geautomatiseerd worden, neemt volgens Heliview toe. Automatisering is daarbij niet langer een lokale aangelegenheid. Er vindt steeds meer distributie van informatie plaats via het intranet of internet. Ook de verbreiding van internet heeft een enorme impact gehad op de manier waarop bedrijven met informatie omgaan. Naast de traditionele informatie in de vorm van tekst, bestaat een steeds groter wordend deel van de informatie uit multimediabestanden zoals afbeeldingen, geluid of videofragmenten. Volgens Heliview speelt Storage Management bij vrijwel elk bedrijf met meer dan vijfhonderd werknemers om die reden een cruciale rol. Voor 2002 wordt dan ook een forse groei verwacht voor de totale storagemarkt. De uitgaven aan storage zouden toenemen tot gemiddeld 11.345 euro per vestiging, nog afgezien van het beheer. Voor de totale markt komt dat neer op ongeveer 930 miljoen euro.
San en nas
Opslag kan op verschillende manieren plaatsvinden. In 32 procent van de gevallen is dat decentraal, waarbij de opslag op het systeem van de gebruiker plaatsvindt. Vooral in het onderwijs (56%), de gezondheidszorg (47%) en de bouwsector (44%) komt deze manier van opslaan relatief veel voor. Typisch voor dit soort bedrijven is dat het aantal werknemers relatief laag is. De tweede manier van opslaan betreft opslag op gedeelde servers. Hoe meer werknemers een bedrijf telt, hoe vaker gedeelde netwerkserveropslag gebruikt wordt. Een bekend probleem met servers die een groot aantal taken moeten verzorgen, is dat ze niet vooruit te branden zijn. De derde oplossing is opslag op een specifieke opslagserver.
Bij het opslaan op servers, zowel gewone als specifieke, zijn twee systemen gangbaar, aangeduid met de jargon-namen san en nas. Bij nas (network attached storage) wordt er, in geval van een tekort aan opslagruimte, eenvoudigweg een server in het netwerk geplugd. Het is makkelijk en goedkoop. Ze worden in hoofdzaak gebruikt door kleinere bedrijven die een eenvoudige en snelle uitbreiding van het netwerk wensen. De Duitse Commerzbank gebruikt een nas als back-up. De bank doet het, omdat het een economisch verantwoorde manier biedt om data te beschermen.
Het Amerikaanse Chase Global Private Banking heeft juist een san (storage area network) gekozen voor de routineuze opslag van de dagelijkse activiteiten. San is vooral in de mode onder grote ondernemingen met vele vestigingen, ook al omdat het in aanschaf en beheer nog duur is. Het san koppelt de verschillende opslagruimten in een netwerk aan elkaar, daar die doorgaans slechts voor de helft worden gebruikt. Het maakt een efficiënter gebruik van de aanwezige opslagcapaciteit mogelijk. Chase Global had behoefte aan flexibiliteit om opslagcapaciteit snel vrij te maken. Bovendien biedt het san de mogelijkheid om los van het netwerk een back-up te maken van de te bewaren data.
Volgens PricewaterhouseCoopers (PwC) verdwijnt de competitie tussen san en nas op termijn. Verwacht wordt dat er hybride systemen ontstaan met bij voorbeeld een san voor de wereldwijde operaties en een nas voor lokale behoeften.