Het world wide web telt zeker 14,3 miljard webpagina’s. Dat heeft de Tilburgse student Maurice de Kunder becijferd. Het Nederlandse web telt minstens 291 miljoen webpagina’s.

De Kunder, student bedrijfscommunicatie en digitale media in Tilburg, heeft zijn afstudeerscriptie aan het onderwerp gewijd. Gewoon tellen zou de duur van de studie aanzienlijk verlengen. Daarom hanteerde De Kunder een methode die uitgaat van woord- en documentfrequenties in verschillende tekstverzamelingen.

Als een woord in dertig artikelen voorkomt in een verzameling van 30.000 krantenartikelen, dan is de verwachte documentfrequentie van dat woord 1 op 1000.

Wanneer een zoekmachine meldt dat er 9 miljoen webpagina’s zijn waarop dat woord voorkomt, dan is het aannemelijk er 9 miljard webpagina’s te vinden zijn.

De Kunder herhaalde de rekensom voor een groot aantal woorden en kon op die manier de omvang van de database van de zoekmachines Google, Yahoo Search, MSN Search en Ask schatten. Maar omdat de machines voor een deel dezelfde sites vinden, moest de student via een steekproef de overlap er uit halen. Die correctie bracht De Kunder op 14,3 miljard. Volgens de student groeit het wereldwijde web met 2 procent per maand.

Bron: World Wide Web telt zeker 14 miljard pagina’s

Be Sociable, Share!