Opera vyvíjí vyhledávací engine MAMA a má zajímavé údaje

Opera Software vyvíjí vyhledávací engine. Jmenuje se MAMA (Metadata Analysis and Mining Application) a indexuje 3.5 miliónu stránek. Jeho hlavním cílem je odpovědět na otázku: „Jak vypadá skutečný web?“ Jedná se tedy o podobnou analýzu, jakou provádí Google, ale výsledky MAMA jsou detailnější. MAMA dokáže vyhodnotit např. kolik webových stránek využívá kaskádové styly, jaký je průměrný počet znaků nebo odkazů na jedné stránce, ve které zemi se nejvíc používá AJAX, mikroformáty apod.

Již dnes jsou k dispozici první výsledky. Zajímá vás, kolik stránek projde validací? Podívejte se na Markup validation report, který obsahuje i zohlednění nejčastěji používaných CMS. Zajímá vás, jak vypadá průměrná webová stránka? Používá doctype HTML 4.x transitional, kódování iso-8859–1, není validní a obsahuje 38 odkazů, kaskádové styly i značku font. Zajímá vás srovnání České Republiky s ostatními zeměmi? Okolo 43% našich stránek obsahuje Flash, což je víc než v USA, kde jich je 32,6%, ale méně než v Čině, kde se jedná o 64%. Naopak AJAX používá v České republice pouze 2.88% stránek na rozdíl od Norska, kde je to 10,18%.

Více o MAMA najdete v tiskové zprávě a v článku What is the Web made of?.

Martin Hassman založil a vede magazín Zdroják. Absolvoval VŠCHT Praha. Byl u založení projektu CZilla (dnes už nepamatujete, nevadí). Stavěl mosty a metal cestu pro HTML5 (to tu ještě máme). V GUG.cz organizoval akce pro vývojáře (a jestli neumřeli, kódují si dodnes…).

Komentáře: 3

Přehled komentářů

Satai Vyhledavac?
Martin Hassman Re: Vyhledavac?
Tom Re: Vyhledavac?
Zdroj: https://www.zdrojak.cz/?p=109