In de ict-wereld lijkt het een gegeven: de opslagcapaciteit in datacenters groeit met een ijzeren regelmaat. Dichtbij huis vormen externe schijven van 500 gigabyte voor privégebruik geen uitzondering. De standaard ict-oplossing bij te krappe opslagcapaciteit lijkt te zijn: “dan prikken we er toch een schijfje bij, opslag kost toch niks meer!”. Michiel Cuijpers vindt dit echter wel erg kort door de bocht. Volgens hem moet je grip op je bedrijfscontent krijgen.
Kijkend naar de enterprise content management (ecm)-software leveranciers is het opmerkelijk dat alle grote spelers in de afgelopen jaren opgekocht zijn door nog grotere hardware leveranciers. Voorbeelden zijn Trim software dat in 2008 door HP is gekocht, Documentum dat in 2003 door EMC2 werd ingelijfd en Filenet dat in 2006 een 'IBM company' werd. Deze hardware leveranciers hebben al vroeg gezien wat een it-afdeling nu aan den lijve ondervindt: de groei van opslagcapaciteit ten behoeve van bedrijfscontent lijkt onverzadigbaar en dus is daar geld te verdienen.
Ongecontroleerd
Nu is het gecontroleerd laten groeien van bedrijfscontent niet per definitie een slechte zaak. Het ongebreideld laten groeien zonder goed te weten wat er allemaal wel en wat niet opgeslagen wordt is dat duidelijk wel. Het probleem zit namelijk in de 'findablity', ofwel de adequate terugvindbaarheid van waardevolle bedrijfscontent. Het al oude 'door de bomen het bos niet meer zien' doet in dat geval weer opgeld. Het missen van belangrijke stukken op cruciale momenten is zeer pijnlijk en niet aan klant, burger of rechter uit te leggen.
Nu is het gelukkig zo dat ecm-systemen krachtige functionaliteiten bieden om juist wel een gecontroleerde groei in combinatie met een hoge mate van findability te bewerkstelligen. Te denken valt aan versiebeheer, het automatisch ontdubbelen van bestanden en het automatisch verwijderen van obsolete versies. Het is echter niet altijd zo dat al deze functionaliteiten bedrijfsbreed geïmplementeerd zijn en dus laat de reikwijdte van het ecm-systeem te wensen over. Mensen slaan hun bedrijfscontent dan vrolijk op in schaduwdossiers op het bedrijfsnetwerk of erger nog, op hun eigen C-schijf op hun privé-computer.
Ongeïnteresseerd
Om echt grip te krijgen op je content moet er een verandering in het denken over contentopslag komen. Het denken over opslag richt zich nu op het 'vervoermiddel' van content, de zogenaamde bestanden van het type .pdf, .doc(Word), et cetera.
Rapportage op deze 'vervoermiddelen' levert voor het lijnmanagement niets zeggende rapportages, zoals 'De afdelingsschijf bevat 12.450 pdf-bestanden waarvan er maar liefst 360 stuks dezelfde naam hebben en er 145 exact dezelfde grootte hebben'. Bij het lezen van dit soort rapporten van het type 'droge it-kost' zou ik ook denken, " beste it-afdeling, prik er nog maar een schijfje bij".
Het woord
Als je echter de inhoud van de bestanden gaat analyseren en daarover gaat rapporteren, kom je bij de werkelijk interessante eenheid van content, het woord. Rapportages op combinaties van woorden die in de organisatie gebruikt worden geven een veel herkenbaarder en dus beter overzicht over de aanwezige content. Het wordt dan mogelijk om een lijnmanager een rapport te geven op basis van de woorden die hij en zijn medewerkers in hun vakgebied gebruiken.
Reken maar dat deze rapporten een alarmerende werking zullen hebben, als duidelijk wordt hoeveel vervuiling er zit in de bestanden waar deze woorden in 'leven'. Het wordt dan mogelijk om op basis van hun eigen idioom, de rotte plekken te duiden waar problemen zijn met de opslag.
Een rotte plek is de netwerkmap waar kriskras verschillende versies van belangrijke contracten staan. Een andere rotte plek is een database management systeem (dms)-locatie waar de verkeerde toegangsrechten actief zijn, waardoor de privacy in het geding kan komen. Het wordt mogelijk om netwerkmappen of laptops te doorzoeken en een analyse te maken van de daar voorkomende woorden als exponent van de daar verborgen kennis van een (oud)medewerker.
Ommekeer
De ommekeer zit in het feit dat de lijnmanager een herkenbaar rapport krijgt met daarin een overzicht van de gesteldheid van zijn content en niet van het aantal gigabytes. De gesteldheid wordt gemeten aan de hand van voor hem herkenbare woorden, sleutelzinnen en idioom. Indien uit het rapport blijkt dat zijn bedrijfsproces 'at risk' is, omdat de gesteldheid van de content te wensen overlaat, wordt hij gealarmeerd op inhoudelijke gronden. Hij zal zijn medewerkers daadwerkelijk aansporen om ordentelijk met de woorden en daarmee met de bestanden en in essentie met de kostbare kennis om te gaan.
Dit leidt tot een beter, breder en completer gebruik van het beschikbare ecm-systeem. Dit leidt uiteindelijk tot meer grip op de content en misschien tot de opmerking: "wacht nog maar even met een schijfje erbij prikken".
Content Analytics
De techniek waarmee je uiterlijke kenmerken van bestanden koppelt aan inhoudelijke kenmerken wordt 'content analytics' genoemd. Het maakt gebruik van de uitgebreide mogelijkheden die de moderne zoektechnologie ons biedt, in combinatie met de algemenere hygiëne factoren, zoals aantal en grootte van een bestand. Het doel van de analyse is een inhoudelijk oordeel te geven over de gesteldheid van de bedrijfscontent. De grondslag is het in kaart brengen van combinaties van belangrijke woorden, in relatie tot de mate van gestructureerde opslag van het document. Door deze inhoudelijke insteek ontstaat een echte awareness over de ‘digitale bende' die voor het oog onzichtbaar in de systemen heerst.
Michiel Cuijpers, managing consultant Content Strategy