Sun Microsystems heeft vorige maand in allerijl een probleem met zijn nieuwste Ultrasparc III-processor opgelost. Vorige week kwam naar buiten dat die Risc-chips (reduced instruction set computing) fouten kunnen maken bij berekeningen met een zwevende komma (floating point operations). De door Sun uitgebracht softwareoplossing schakelt een bepaalde functie in de processor uit. Dit kan het prestatieniveau van bepaalde applicaties met 5 procent verlagen.
Dit deelde het bedrijf eind vorige week mee nadat het de oplossing had geopenbaard. Sun zegt geen rapporten te hebben ontvangen dat klanten zijn geconfronteerd met dit probleem. "We hebben nog geen voorvallen in de praktijk gezien", zegt directeur Fred Kohout, die bij Sun de producten voor technische markten (wetenschappelijke toepassingen – red.) overziet. Hij stelt dat het probleem de meeste gebruikers niet raakt. "We hebben de fout alleen maar weten te reproduceren in het laboratorium."
De nieuwe Ultrasparc III-processor is in gebruik in de in september gelanceerde Sunblade-werkstations en lichte Sunfire 280r-servers, en in de vorige maand onthulde Sunfire-midrangeservers. De fabrikant zegt tot 14 maart Sunblade- en Sunfire 280r-machines te hebben geleverd die kunnen lijden aan het probleem.
Systemen die na die datum zijn geleverd, zijn echter voorzien van de softwarefix. Dit geldt voor de latere leveringen van de Sunblade en voor alle Sunfire-machines. De oplossing is ook geïnstalleerd bij klanten die reeds Sunblade-computers hebben staan, aldus Sun. De volgende revisie van de 900 MHz Ultrasparc III bevat een hardware-oplossing voor het probleem. Het is echter nog niet bekend wanneer die herziene chip uitkomt.
Overigens verscheen de Ultrasparc III-processor, codenaam Cheetah, ruim een jaar te laat. De producent heeft de opgelopen vertraging consequent geweten aan de uitvoerige testen waaraan de chip is onderworpen. Sun-president Ed Zander stelde bij de lancering van de processor en de Sunblade-werkstations dat die chip hierdoor superieur is aan concurrerende producten. Deze eerste Ultrasparc III-systemen kwamen ‘slechts’ driekwart jaar te laat; volgens Suns oorspronkelijke planning hadden die begin vorig jaar moeten verschijnen.
Voorspelfout
Het probleem betreft Ultrasparc III-chips op kloksnelheden van 600, 750 en 900 MHz. Het gaat om een fout in de prefetch-pijplijn van de mathematische coprocessor in de Ultrasparc III. De functie van dat component is het voorspellen van het volgende blok data dat de processor nodig heeft. Die informatie kan dan alvast vanuit het hoofdgeheugen naar het cachegeheugen worden gekopieerd zodat de processor er sneller over beschikt. Geheugenchips zijn namelijk aanzienlijk langzamer dan processoren. Cachegeheugen vormt een tussenlaag die deze discrepantie moet verminderen.
De fout in de voorspellende pijplijn kan leiden tot fouten in berekeningen met zwevende komma’s. Sun stelt dat dergelijke bewerkingen voornamelijk worden uitgevoerd door computergebruikers in de wetenschappelijke wereld.
De systemen van die klanten lopen door het uitschakelen van de pijplijn een prestatievermindering van 0 tot 5 procent op. "De meeste klanten zullen echter geen verschil opmerken. Het grote en groeiende deel van onze markt wordt hier niet door geraakt", aldus topman Kohout. Hij stelt dat het produceren van de oplossing geen aanzienlijke kosten met zich meebracht.
Vraag en aanbod
De nieuwe Ultrasparc III-systemen blijken dusdanig in trek dat Sun tot op heden moeite heeft voldoende exemplaren te produceren. De resulterende wachtlijsten hebben nu een positief gevolg; relatief weinig machines zijn reeds in gebruik, waardoor het processorprobleem voornamelijk een imagokwestie is. "Het is geen dramatisch probleem, maar slechts ongewenst slecht nieuws voor Sun", meent analist John Jones van investeringsbank Salomon Smith Barney.
Toch is het een redelijke klap voor Sun. Begin september vorig jaar – kort voor de lancering van de Ultrasparc III – werd het imago van de Unix-leverancier al besmeurd. Enkele exemplaren van diens Ultrasparc II-processor bleken al geruime tijd te kampen met fouten in het cachegeheugen, wat tot datacorruptie kon leiden. Dit betrof de 400 MHz-uitvoeringen met 4 en 8 MB aan extern cachegeheugen. Deze chips zijn toegepast in de zware serverreeks Ultra Enterprise.
II + III
John Shoemaker, vice-president bij Sun, gaf in september toe dat het Ultrasparc II-probleem al ruim anderhalf jaar speelde. Hij benadrukte daarbij dat het slechts een paar dozijn klanten raakte. Analisten van onderzoeksbureaus Gartner en Metagroup lieten echter weten dat meer Sun-klanten met dit probleem kampten.
De serverleverancier was volgens Shoemaker al een jaar bezig met het zoeken naar de oorzaak en een oplossing. Dat de fout pas na lange tijd in de openbaarheid kwam is mede veroorzaakt doordat Sun de getroffen klanten een geheimhoudingsverklaring liet ondertekenen. Shoemaker gaf in september direct toe dat dit geen goed idee was en dat deze activiteit is gestaakt. De oorspronkelijke reden voor de geheimhoudingsverklaring was het feit dat Sun zelf nog geen oorzaak had gevonden, aldus de vice-president.
Eind vorig jaar heeft Sun een chipmodule uitgebracht die het externe cachegeheugen spiegelt en zo het probleem moet oplossen. Woordvoerders van het bedrijf stellen dat het geen groot probleem betreft. Bovendien zou het zich niet in Nederland voordoen omdat de ‘verdachte’ Ultra Enterprise-configuraties hier niet aanwezig zijn. Dezelfde argumenten zouden nu gelden voor het Ultrasparc III-probleem in de nieuwe werkstations en middelzware servers.