Winkelmand

Geen producten in de winkelwagen.

Ict-special – Heel internet lezen? Het kan!

Internet is een snel medium en wat daar over uw organisatie wordt gezegd is nauwelijks te volgen, laat staan controleren. Morgen kan een rel losbarsten in forums en blogs met uw product als lijdend voorwerp. Text mining is middel om de eigen organisatie én omgeving in de gaten te houden.

 

In maart 2006 werd Bakers Footwear, een Amerikaanse schoenenketen met 200 winkels, overvallen door een campagne van dierenactivistenclub Peta. Het ging om de bontreepjes aan trendy laarsjes, die volgens Bakers van konijnenbont waren maar volgens Peta afkomstig van katten en honden die in China op gruwelijke wijze (levend) gevild zouden zijn. De aanklacht ging vergezeld van nare filmpjes over de Chinese bonthandel en het telefoonnummer en emailadres van Peter Edison, de ceo van Bakers, inclusief een voorbeeldbrief. De campagne, die kwam op het moment dat Bakers toch al financiële problemen had, was een zware slag voor het imago van de winkelketen.

Schandaaltjes steken elke dag de kop op. Het RVU-programma Keuringsdienst van Waarde meldt dat er nepkaas wordt gebruikt door McDonalds, Albert Heijn en Coop. Op websites krijgt ict-bedrijf Logica ervan langs als medeaanstichter van het UWV-debacle. In blogs en op sites als Geenstijl.nl delen mensen hun ongenoegen over uw producten of diensten met de hele wereld, behalve met u.

Brandjes blussen

Uw imago bewaken is een van de nuttige toepassingen van text mining, een onderdeel van de business intelligence. Text mining doet precies wat de naam doet vermoeden, het analyseert teksten en toont verbanden aan die een mens mogelijk over het hoofd zou zien. Het leent zich niet alleen voor graven in teksten die binnen de eigen muren zijn getikt, met net zoveel gemak neemt de software het hele internet onder de loep. Dat bestaat immers ook vooral uit woorden. Daarmee is de software ineens niet alleen een ultieme marketingtool, het biedt ook de kans vroegtijdig brandjes te blussen die anders uit de hand zouden kunnen lopen.

Andere toepassingen van text mining liggen onder meer op het gebied van de compliance, het opsporen van fraude en kennismanagement. Text mining vereist specialistische programmatuur die, net als andere software voor business intelligence, analyses loslaat op beschikbare informatie en rapportages maakt. In veel business intelligence-pakketten zijn al functies voor text mining aangebracht, zodat de kans bestaat dat u de tools al in huis hebt.

Een deel van de informatie over klanten en de markt zit besloten in transactionele en logistieke systemen, in verkoopgegevens en financiële data. Om dat in een datawarehouse te stoppen en er analytische software op los te laten is een gelopen race. Veel meer kennis (schattingen variëren van 70 tot 80 procent) zit echter in ongestructureerde data: in e-mails, rapporten, notities van het callcenter, newsfeeds, sociale netwerken, forums, wiki's, blogs en de mailbox info@bedrijfsnaam. Dat is allemaal tekst.

Wat text mining-software doet is daar structuur in aanbrengen, aldus Jaap Vink, systems engineer manager Noord-Europa van SPSS, maker van analytische software. "De software gaat door de tekst heen bijna zoals een mens dat zou doen. Hij kijkt naar structuur, grammatica, verschijningsfrequentie van woorden en dat soort zaken. En hij legt onderlinge relaties."

Je zou ook mensen de teksten kunnen laten lezen, maar dat is duur en er is een grens aan wat een mens op een werkdag allemaal kan lezen. Een ander nadeel is dat relaties niet boven water komen als ze in teksten staan die door verschillende personen worden gelezen. Vink herinnert zich een case bij het Korps Landelijke Politiediensten waar informatie gezocht werd op in beslag genomen computers. "Daar was na drie maanden onderzoek nog niks gevonden. Met text mining had men binnen vijf minuten een relatie gevonden tussen twee personen. Het brak de hele case open."

Veiligheid

Tekstanalyseprogramma's moeten beschikken over veel talenkennis, aldus Jos Kuijer, solution architect bij SAP Nederland. SAP is bekend van zijn erp-pakketten en nam vorig jaar Business Objects, gespecialiseerd in business intelligence, over. Voor analyses van het mondiale internetverkeer zijn Europese talen niet genoeg, er moet bijvoorbeeld ook in het Chinees en Japans kunnen worden gezocht. Daarnaast moet de software in staat zijn de personen en bedrijven in context te plaatsen.

De ‘roots' van text mining ligt in de veiligheidssector. Kuijer: "Als je ‘bom' en ‘Osama Bin Laden' en ‘Binnenhof' in je mailtje zet, begint er bij veiligheidsdiensten een lichtje te knipperen." Er is een hele softwarebranche ontstaan om de gegevensstromen op internet zo goed mogelijk te analyseren op potentiële gevaren.

Dat leidde al snel tot andere toepassingen. Kuijer noemt een voorbeeld uit de tabaksindustrie. Een producent houdt de handel in de gaten op internationale veilingsites. Op enig moment kan het gebeuren dat partijen worden aangeboden tegen verdacht lage prijzen. Dan kan er sprake zijn van namaak of vervalsing. Kuijer: "Op dezelfde manier wordt de verkoop van partijen medicijnen in de gaten gehouden. Bij namaakmedicijnen is het bijkomende risico dat de volksgezondheid in gevaar komt."

Een oliemaatschappij die klant is bij SAP (Kuijer: "Ik mag de naam niet noemen, maar het is niet Shell") is boringen aan het voorbereiden bij de Kaspische Zee. Het gaat om een natuurgebied waar bijzondere vogels voorkomen en de boringen moeten met de grootst mogelijke voorzichtigheid worden gedaan. Met tekstanalyses is gezocht naar alle mogelijke gegevens over het gebied en naar mogelijkheden voor milieuvriendelijke productie.

In Amerikaanse bedrijven wordt text analytics gebruikt om de compliance te ondersteunen. De software houdt uitgaand mailverkeer in de gaten om te voorkomen dat bedrijfsgevoelige informatie naar buiten gaat.

Signaal

Als er zaken worden geschreven die het bedrijf in problemen kunnen brengen, gaat er een signaal naar de juridische dienst. Kuijer: "Of het in Nederland ook wordt gebruikt, weet ik niet. Je moet er, als je bij een bedrijf werkt, van uitgaan dat al je mailtjes 24 uur per dag in de gaten kunnen worden gehouden."

Het grote voordeel van text mining is dat het bedrijven veel vrijheid geeft om te zoeken, zegt Edwin Peters, manager business unit solutions van SAS Nederland, een Amerikaans in business intelligence gespecialiseerde softwarebedrijf. De gestructureerde data die traditioneel worden gebruikt voor business intelligence zijn vaak aanwezig in spreadsheets en rapporten voor intern gebruik. Peters: "Veel toepassingen van business intelligence hebben een intern perspectief, met text mining kun je de blik meer naar buiten richten."

Een analyse van de merkbeleving is een voorbeeld van een nuttige toepassing. Er zijn ook telecombedrijven, geconfronteerd met klanten die naar de concurrentie overstappen, die uit callcenter-boodschappen afleiden wanneer de kans groot is dat een klant vertrekt, zodat ze tijdig kunnen ingrijpen. De Amerikaanse witgoedproducent Whirlpool analyseert de klachten die bij het callcenter binnenkomen, om defecten in apparatuur zo snel mogelijk op het spoor te komen. Peters: "De cyclus van het opsporen en corrigeren van productiefouten is met ongeveer drie maanden bekort."

Een ander voorbeeld is de Nederlandse douane. In een pilotproject zijn er analyses gedaan van de aangiftes die bij import naar de douane worden gestuurd. Door te letten op afwijkingen en het berekenen van karakteristieken en trends, kan de software voorspellen wanneer aangiftes onjuist zijn. De douane wordt tijdig gealarmeerd als het zaak is extra onderzoek in te stellen. "De software heeft lerend vermogen", zegt Peters, "dus de analyses worden steeds beter."

Taal is levend. Internettaal is bovendien een heel apart ‘dialect' dat bedoeld en onbedoeld vol taalfouten staat. Hoe begrijpt software wat voor een mens soms al lastig te duiden is? Hoe weet het systeem dat ‘SendByGod' het over een iPod heeft als hij ‘kudt ding' schrijft?

Relaties

Vink van SPSS beaamt dat er grenzen zijn aan de vermogens van het systeem. "Wat de software kan, is de taalstructuur en de relaties begrijpen. Dat moet je verfijnen en aanscherpen voor bepaalde domeinen. Dat is mensenwerk." Linguïsten zorgen dat de software de syntaxis en morfologie van meerdere talen kan analyseren. Gebruikers kunnen volgens Vink voor een bepaald onderwerp een betekenislaag toevoegen. "Je kunt de software leren dat in een bepaalde context een woord als bank een andere betekenis heeft."

Text mining kan aan een aantal problemen een einde maken. De software vereenvoudigt tevredenheidsonderzoek en de verwerking van klachten. Vink: "Als je kijkt naar klachtensystemen, zie je vaak dat organisaties hebben geprobeerd de klachten te rubriceren in categorieën. En ook al is daar vaak heel hard over nagedacht, onze ervaring is dat meer dan 60 procent van de klachten in de rubriek ‘overig' staat. Ik heb systemen gezien waar je al vijf minuten nodig hebt om alleen door de rubriekslijst heen te lopen. Daar heeft toch niemand tijd voor?"

Een voordeel voor de marketingafdeling is dat onderzoek een doorlopend proces wordt. "Marktonderzoek is nu vaak een momentopname", zegt Vink. "De resultaten zijn soms al verouderd bij publicatie omdat de vragen zes weken gelden zijn geformuleerd." Bedrijven kunnen niet meer om continu-onderzoek en -analyse heen, meent Vink. "Bedrijven die niet naar hun klanten luisteren, verliezen de slag. Organisaties die succesvol zijn, hebben dat mede te danken aan het feit dat ze steeds meer analyseren."

Gebakken lucht

Volgens onderzoeksbureau Gartner staat business intelligence-software wereldwijd nummer één op de prioriteitenlijst van cio's. Er wordt veel in geïnvesteerd. Dit soort verwachtingen over de doorbraak van business intelligence wordt echter al jaren verkondigd. De toepassing blijft vooralsnog achter bij de prognoses. Gebruik vergt soms specialistische kennis en de interpretatie van onderzoeksresultaten kan lastig zijn. Text mining kan daar verandering in brengen.

Text mining is begrijpelijk en snel toepasbaar. Kuijer van Vink waarschuwt echter voor overdreven verwachtingen. "Er is in de ict al snel gebakken lucht over hightech-producten. Je moet je als bedrijf goed afvragen welke informatie je werkelijk wilt hebben. Er kan heel veel met de software, maar wat heb je écht nodig?"

Bankverzekeraar ING Groep heeft recentelijk een speciale afdeling Customer Intelligence opgericht. Maar volgens Niels van Weeren, die leiding geeft aan de nieuwe unit, is text mining "geen onderwerp dat speelt". De software is inmiddels beschikbaar, als onderdeel van het pakket van Business Objects dat in huis is. Text mining is nog geen prioriteit.

Dagelijks de nieuwsbrief van Management & Leiderschap ontvangen?



Door je in te schrijven ga je akkoord met de algemene en privacyvoorwaarden.

Vertegenwoordigers van de software-industrie zijn echter optimistisch. "Een mens is niet alleen de transacties die je met ze gedaan hebt," stelt Vink van SPSS. "Een mens heeft een mening, een houding. Als je een 360 graden-beeld van je klanten wil hebben, moet je niet alleen kijken naar interne gegevens."

Volgens Gartner zijn de winnaars van de toekomst de bedrijven die in staat zijn business intelligence een centrale en strategische rol te geven in de besluitvorming. Niet ieder bedrijf is daar even goed in. De Japanse auto-industrie heeft zijn leidende rol bijvoorbeeld mede te danken aan het vermogen sneller te schakelen dan de Amerikaanse. De laatste zijn te laat met de overgang naar kleine, energiezuinige auto's. Trends, marktkansen en positieve of negatieve signalen van klanten zijn steeds vaker op internet te lezen. Vink: "Daar kan je je voordeel mee doen. Of de slag missen als je kiest voor struisvogelpolitiek."