Jak funguje Google?

Položili jste si někdy už tuto otázku? Víte na ní odpověď? Pokud ne, pokusím se vám trošku přiblížit, jak je možné, že Google ten internet prohledá tak rychle. Nejde mi o to, přesně vysvětlit, jak to funguje jako spíše tento problém přiblížit těmneznalým.

Pokud zadáme do vyhledávacího pole nějaké heslo, Google nám ihned ukáže výsledky vyhledávání, které trvá jen zlomek sekundy. Pokud zadám dotaz emo, najde mi asi 86 600 000 odpovědí za 0,06 sekund. Jak jen tohle možné? Tajemství tkví v tom, že Google vysílá po síti roboty, někdy se jím také říká pavouci. Stahují navštívené stránky do hlavní databáze vyhledávače.

Právě tam začíná i pavoukova cesta. Nalezne si nějaký odkaz, následně se vydá na tuto stránku. Ve zdrojovém kódu si najde odkazy v párových značkách <a>… Jakmile odkaz nalezne, stránku načte a to několikrát opakuje. Pokud další odkazy nenajde, vrátí se o úroveň zpět a pokračuje.

Nevyplatí se odkazovat na stránky, které ještě neexistují, protože pokud pavouk takovou nalezne, zařadí ji mezi nefunkční a znovu navštíví až po měsících. Takže pokud odkážete na stránku, kterou ještě nemáte a najde si jí pavouk, nemůžete po zprovoznění čekat, že se vám na stránky povalí zástupy lidí z vyhledávače, protože pro něj jsou vaše stránky stále nefunkční.

PageRank

Je potřeba vyhledané výsledky nějak seřadit, proto se vývojáři snaží o nějaké hodnocení stránek. První vyhledávače se omezovali na frekvenci výskytu hledaného slova, to je ale snadno využitelné, stačí napsat stránku, kde se bude tisíckrát vyskytovat slovo „autobazar“, a všichni, kdo budou shánět ojeté auto budou odkázáni na nefunkční a nesmyslnou stránku.

Proto byl vymyšlen algoritmus, který hodnotí stránky podle toho, jak je na ně odkazováno. Funguje to docela jednoduše – stránka A má PageRank 5 a odkazuje na 10 dalších stránek. Každá stránka od stránky A dostane doporučení 0,5. Stránka B, na kterou odkazuje stránka A má Pagerank 1, protože od stránky A dostane doporučení 0,5, od stránky C 0,2 a od stránky D 0,3.

Čím vyšší PageRank, tím více je stránka upřednostňovaná. Ale není to jediný faktor, podle kterého Google výsledky vyhledávání řadí.

Svůj PageRank jednoduše zjistíte na http://pagerank.yuhu.cz/, kde můžeme i získat PageRank ikonku od Yuhůa na své stránky. Je tam i poměrně dobře napsáno, jaký PageRank můžeme očekávat.

Příspěvek byl publikován v rubrice Blogování. Můžete si uložit jeho odkaz mezi své oblíbené záložky.

Napsat komentář

Vaše emailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *