Microsoft doet verwoede pogingen om het terugvinden van gegevens in te bouwen in besturingssysteem Windows. Het experimenteert daarvoor met een handvol zoektechnologieën. Google, nu de mestgebruikte zoekmachine op internet, krijgt het nog zwaar.
Microsoft moet een fors bedrag overhebben voor het oplossen van een van de grotere irritaties van het gebruik van een kantoor- of thuis-pc. Verschillende teams van ontwikkelaars werken aan methodes om gegevens terug te vinden in bestanden gemaakt met tekstverwerker of spreadsheet, in presentaties, in e-mails, video en audio-bestanden en die lokaal of ergens in het netwerk of op internet zijn opgeslagen.
Sinds afgelopen herfst is bekend dat er geëxperimenteerd wordt met ‘Implicit Query’. Deze toepassing houdt bij wat de gebruiker aan het doen is, en zoekt daar voortdurend passende informatie bij. Die wordt gepresenteerd als (hyper)links naar tekst, e-mails of zelfs muziekbestanden die in relatie staan met het onderwerp.
Implicit Query past de interne filters aan naarmate de tijd die een gebruiker met dit systeem werkt. Zo kan het, hoopt de softwarefabrikant, steeds beter de relevante gegevens aanreiken. In een voorbeeld-presentatie mailt een onderzoekster bij Microsoft over een probleem met de interne website. Nog voor het mailtje klaar is, presenteert Implicit Query een ongelezen mailtje met daarin de oplossing. De techniek leunt zwaar op de techniek die ook achter de huidige automatische wizards schuilt – de statistische informatietheorie van Bayes. "We onderzoeken de tekst die je onderhanden hebt en halen daar belangrijke woorden uit waar we automatisch een zoekopdracht voor uitvoeren", citeert internetnieuwsdienst News.com onderzoekster Susan Dumais in november.
De toponderzoekster werkt bij het Microsoft-lab ‘Adaptive Systems and Interactive Group’. Ze houdt nauw contact met topman Bill Gates, die het verbeteren van de zoekmogelijkheden behoorlijk hoog heeft staan. Ze schetst het principe: "Ik wil mijn werk niet onderbreken, dus laat me de resultaten maar zien." Dumais stelt dat pc-gebruikers een hoop tijd besteden aan het rangschikken van bestanden, als een archivaris.
Office-assistent
Een niveau hoger in de test-bank zit Sis (‘Stuff I’ve Seen’) – een zoekprogramma voor bestanden op de desktop. Dit experimentele programma wordt door zo’n duizend interne pc-gebruikers beproefd. Het lab van Dumais houdt de benutting van Sis nauwkeurig in de gaten. Sis maakt een index van gegevens op de harde schijf van de pc. Een gebruiker kan op verschillende manieren deze index raadplegen. Dat vereist een heuse opdracht; het gedraagt zich niet als een soort Office-assistent Clippy die allerlei bestanden aandraagt.
De meest rigoureuze aanpak is het inbouwen van onderdelen van databank SQL Server in de volgende versie van het besturingssysteem Windows. Er wordt noest aan gewerkt. De prille schetsen dateren uit begin jaren negentig. Een eerste, ruwe versie resulteerde met Windows 2000 tot de zogenoemde Active Directory. Dat beheerhulpmiddel strekte zich echter niet uit tot de inhoud van de data of het bestandsysteem. Dat leek lange tijd te complex.
Gates kondigde de langgezochte doorbraak afgelopen augustus aan. Het heet Windows Future Storage (Winfs), en is een combinatie van Yukon, de opvolger van Microsofts database SQL Server, met het huidige bestandssysteem Ntfs (NT File System).
Het nieuwe bestandssysteem wordt een laag bovenop Ntfs, maar introduceert indexering voor de content. Hiervoor gaat het met XML opmaakcode genereren die het opslaat in een SQL-database. Zo dempt het de kloof die tot nu toe gaapt tussen de geïndexeerde data in een database en de ongeordende gegevens in Word-documenten, webpagina’s en e-mails.
Losgekoppeld
Winfs wordt niet voor 2005 verwacht: de hele Windows-shell moet er voor worden omgegooid. Ook de bekende applicaties in kantoorsuite Office en mailprogramma Outlook moeten opnieuw in elkaar gezet, willen ze gebruik kunnen maken van de nieuwe methode voor data-opslag. Die programma’s hebben nu nog allemaal een eigen manier van opslaan – zo verdwijnt een bijlage in een mailtje uit het blikveld van Outlook wanneer het wordt losgekoppeld. Die correlatie in stand houden, is een van de mogelijkheden die Winfs moet bieden.
De mogelijkheden van Winfs doen bij sommige analisten onwillekeurig gedachten aan Google opkomen. Afgelopen april werd bekend dat het bedrijf uit Redmond een eigen zoekmachine wil bouwen, die het moet kunnen winnen van Google.
Die zoekmachine verwerkt dagelijks gemiddeld tweehonderd miljoen zoekopdrachten. Geschat wordt dat het 80 procent van alle zoekopdrachten op internet afhandelt. Microsof wil in eerste instantie het zoeken van informatie makkelijker maken, een nobel doel. Het zou dief van de eigen portemonnee zijn als het daarvoor niet de eigen internet-mogelijkheden inzet. Daarvoor is een blik op de omzetcijfers van zowel portaalsite MSN als die van zoekmachine Google voldoende: vele, vele miljoenen. Een tweede hint kwam twee weken terug; het bedrijf publiceerde toen een bètaversie van een hakbal voor de eigen webbrowser Internet Explorer; die leidt alle zoekopdrachten via de portaal-site MSN.
Alle zoekmogelijkheden bij elkaar beschouwd, staat de Windows-gebruikers best wat te wachten. "Wanneer Microsoft begint met het zoeken, wordt de rest een voetnoot", aldus een van de redacteuren op een webforum voor zoekmachines, Li’l Engine. "Google? Yahoo? Looksmart of Ask Jeeves? Vergeet het maar."< BR>