Az oldal még szerkesztés alatt áll!
Az egy évvel ezelőtti vizsgálatokhoz (Keresőoldalak összehasonlítása (2004. február)) képest egyszerűbb dolgom van,
tekintve, hogy a Yahoo! bevásárolt keresőkből, így az olyan oldalak
mint az [altavista.com]? vagy az [alltheweb.com]? találatai is már a
Yahoo! által fejlesztett adatbázisból származnak. Emellett a [Google]?
maradt az egyetlen nemzetközi oldal, ahol magyar nyelvre leszűkítve is
lehet keresni. (Az [MSNsearch]? és a [Teoma]? oldalain nincs erre
lehetőség.) A magyar oldalak közül a [vizsla]? került górcső alá, ami a
Yahoo! adatbázisából származó találatok alapján működik, ezenkívül a
goliat.hu és mint új szolgáltatás a SZTAKI kereső működését
vizsgáltam.
Találatok számának elemzése a leggyakoribb húsz magyar szó alapján
Beindexelt oldalak száma
Az egyik legfontosabb kérdés, hogy hány magyar nyelvű oldal szerepel
a keresőoldalak adatbázisában. Feltételeztem, hogy a leggyakoribb
magyar szavakra rákeresve következtetni lehet a beindexelt lapok
nagyságrendjére. Ritka szavak esetén szintén sokatmondó lehet a
találatok száma, azonban ebben az esetben nagyobb a véletlen szerepe a
kapott eredményekben. Ezért tehát a SzóSzablya projekt által kimutatott leggyakoribb húsz magyar szóra kerestem rá.
- korántsem biztos, hogy valóban annyi lap szerepel az adatbázisban, mint amennyit a keresőoldal kijelez.
- majdhogynem természetes, hogy nem magyar nyelvű oldalak is szerepelnek a kapott találtatok között, tehát ha egy kereső rosszabb hatékonysággal különbözteti meg a magyar tartalmat a nem magyar tartalomtól, akkor úgy tűnhet, hogy nagyobb az adatbázisa.

Kimagaslóan a legtöbb oldalt a goliat.hu jelezte ki, bár az első négy szóra nem engedett rákeresni. Utána
következett a [Google]?, majd a Yahoo! kereső. A szintén a yahoo!
adatbázisából dolgozó [vizsla]? már jóval kevesebb oldalt jelzett ki
magyar nyelvű oldalnak, míg a kísérleti üzemmódban működő SZTAKI kereső
lett az utolsó ebből a szempontból.