Opera vyvíjí vyhledávací engine MAMA a má zajímavé údaje
Nálepky:
Opera Software vyvíjí vyhledávací engine. Jmenuje se MAMA (Metadata Analysis and Mining Application) a indexuje 3.5 miliónu stránek. Jeho hlavním cílem je odpovědět na otázku: „Jak vypadá skutečný web?“ Jedná se tedy o podobnou analýzu, jakou provádí Google, ale výsledky MAMA jsou detailnější. MAMA dokáže vyhodnotit např. kolik webových stránek využívá kaskádové styly, jaký je průměrný počet znaků nebo odkazů na jedné stránce, ve které zemi se nejvíc používá AJAX, mikroformáty apod.
Již dnes jsou k dispozici první výsledky. Zajímá vás, kolik stránek projde validací? Podívejte se na Markup validation report, který obsahuje i zohlednění nejčastěji používaných CMS. Zajímá vás, jak vypadá průměrná webová stránka? Používá doctype HTML 4.x transitional, kódování iso-8859–1, není validní a obsahuje 38 odkazů, kaskádové styly i značku font. Zajímá vás srovnání České Republiky s ostatními zeměmi? Okolo 43% našich stránek obsahuje Flash, což je víc než v USA, kde jich je 32,6%, ale méně než v Čině, kde se jedná o 64%. Naopak AJAX používá v České republice pouze 2.88% stránek na rozdíl od Norska, kde je to 10,18%.
Více o MAMA najdete v tiskové zprávě a v článku What is the Web made of?.
Je to opravdu vyhledavac nebo jenom indexovaci engine?
Opera to nazývá search engine. Zmíněné informace se z těch zaindexovaných stránek nějak museli taky nějak vyhledat (byť tu jde hlavně o data mining). Termín vyhledávač jsem záměrně nepoužil, protože si jej lidé spojují s klasickými vyhledávači a la Google.
Konecne viem, co je to data mining. Diky