Úvod do Sémantického Webu

Idea Sémantického Webu je stará už dost přes deset let, avšak je stále málo rozšířena, i když to vypadá, že se situace poslední dobou mění. Co tedy Sémantický Web je, z čeho se skládá a k čemu by mohl být užitečný? Co znamenají přesně výrazy jako RDF či SPARQL a jak spolu souvisí? Odpovědi naleznete v článku.

Ve světě, kde jsou informace na internetu publikovány technologiemi Sémantického Webu, nemusíte např. hledat pomocí různých vyhledávačů webové stránky svého zubaře, abyste zjistili otvírací dobu, ale váš inteligentní kalendář zjistí, u kterého zubaře jste registrováni, porovná otvírací dobu jeho ordinace s vaším rozvrhem času, zajistí ideální dopravní spojení, a předloží vám možné varianty. Tohle je samozřejmě velmi idealistická vize, avšak možná.

V dalším textu se úmyslně vyhýbám obecně užívanému výrazu „sémantický web“ a používám raději „Sémantický Web“ coby termín, který označuje využití RDF jako hlavního modelu reprezentace informací. – pozn.aut.

Sémantický Web je označení pro skupinu technologií, které umožňují informace na internetu formulovat tak, aby byly srozumitelné nejen pro lidí, ale i pro stroje, tedy hlavně software na nich běžící. U zrodu nestál nikdo jiný než Tim Berners-Lee a konsorcium W3C, které je dodnes hlavním tahounem vývoje v této oblasti. Sémantický Web není konkurencí současného webu, nýbrž jeho doplňkem, zlepšujícím využití potenciálu, který sítě typu internetu mají. HTML popisuje dokumenty a vztahy mezi nimi, účelem technologií Sémantického Webu je popis jakýchkoliv věcí (lidé, věci, služby, události, role…) a vztahů mezi nimi. Takováhle síť se nazývá Sémantický Web, Web of Data, Giant Global Graph, nebo i Web 3.0.

Základní technologie Sémantického Webu jsou: RDF, RDFS, OWL a SPARQL.

RDF, RDFS, SPARQL a další

RDF (Turtle verze) definuje model vyjadřování informací, které jsou formulovány trojicí „podmět přísudek objekt“, kde přísudek určuje vztah mezi podmětem a objektem. Identifikátory, neboli „slova“ tvořící tyto „věty“, jsou URI. Množina trojic tvoří RDF graf. RDF samotné je pouze model, který pro textovou reprezentaci má mnoho serializací – jako nejstarší RDF/XML, potom máme RDFa pro integraci RDF v HTML, dobře čitelnou Turtle, primitivní N-Triples, a další…

Abychom RDF mohli smysluplně využít, tak potřebujeme nějak přiřadit našim „slovům“ význam. Právě k tomu jsou ontologie, RDF slovníky, neboli RDF schémata, např. FOAF (specifikace), SIOC (specifikace), GoodRelations (specifikace)… Ty jsou definovány pomocí RDFS a složitější OWL, které samotné jsou ontologiemi.

SPARQL je jazyk, vycházející z SQL, určený k manipulaci (primárně dotazování) s RDF databázemi (tzv triplestore).

Mikroformáty jsou příbuzné technologiím Sémantického Webu a dají se z nich lehce extrahovat data do RDF pomocí GRDDL, avšak nejsou natolik flexibilní jako RDFa.

Linked data je název pro několika principů, které se snaží zajistit určitou úroveň užitečnosti informací (tvoří podmnožinu Sémantického Webu). Komunitní projekt Linking Open Data publikuje otevřené databáze jako Linked Data, jako nejlepší příklad je DBpedia obsahující data, extrahovaná z Wikipedie.

Linked Data
Ekosystém Linked Data – obrázek pochází z http://www4.wiwiss.fu-berlin.de/…9-03-05.html

Mezi některými oblastmi průmyslu jako například medicína a těžařství jsou tyto technologie rozšířené kvůli potřebě sdílení informací jasné definovanými termíny a automatické dedukce dalších informací.

Implicitní decentralizovanost technologií Sémantického Webu se používá k bourání zdi mezi sociálními sítěmi jako Facebook, Myspace etc., pomoci RDF dat používajících ontologii FOAF, kdy může každý server fungovat jako hosting FOAF profilů, tvořící jednu velkou, otevřenou, decentralizovanou sociální síť.

Protože ne všechny informace jsou určené pro širokou veřejnost, vznikl systém WebAccessControl, který využívá autentizační protokol FOAF+SSL. Tento protokol je rychlejší a jednodušší než OpenID, a ve většině případů i uživatelsky přívětivější (nepotřebujete si pamatovat jméno/id ani heslo, stačí jen mít svůj certifikát).

FOAF

Jak to vypadá v praxi?

Yahoo a Google využívají RDF data ke zlepšení výsledků vyhledávání. (Viz Yahoo embraces the semantic web, Google introducing rich snippets)

Existují projekty sémantického desktopu na linuxu ze stáje KDE (Nepomuk Social Semantic Desktop) i Gnome (Semantic Desktop).

Drupal 7 bude v RDF publikovat svá interní data.

Sémantický Web mezi lidmi nikdy širokého povědomí nedosáhne. Ani by neměl, protože se jedná o vnitřní reprezentaci informací. RDF vzniklo jako odpověď na poptávku po jednotném modelu pro výměnu informací v decentralizované heterogenní sítí systémů. Pokud vyvíjíte aplikaci a chcete umožnit, aby informace byly sdíleny a využívány jinými aplikacemi, publikujte tyto informace v RDF.

Historie a budoucnost

Vývoj Sémantického Webu má tři hlavní odvětví:

  1. Vývoj technologií
  2. Publikování informací pomocí těchto technologií
  3. Vývoj aplikaci a automatických agentů pracující s těmito informacemi

První fáze, kdy se vývoj soustředil především na první odvětví, pominula, teď je třeba rozvíjet druhé odvětví, protože bez něj je nemyslitelný rozkvět odvětví třetího, a přitom právě ono je naším cílem, protože přináší zjednodušení našeho každodenního života.

Pokud máte zájem o další články z této oblasti, například práci s RDF a FOAF prakticky, vyjádřete se v diskusi.

Věděli jste, že nám můžete zasílat zprávičky? (Jen pro přihlášené.)

Komentáře: 44

Přehled komentářů

Jakub Galgonek SPARQL
Radek Re: SPARQL
Jiří Kosek Re: SPARQL
Jakub Galgonek Re: SPARQL
Jezovec Re: SPARQL
Jiří Procházka Re: SPARQL
Jakub Galgonek Re: SPARQL
Franta Re: SPARQL
Jakub Galgonek Re: SPARQL
Franta Re: SPARQL
Jakub Galgonek Re: SPARQL
F123 Re: SPARQL
Jakub Galgonek Re: SPARQL
F123 Re: SPARQL
Jakub Galgonek Re: SPARQL
campula Re: Úvod do Sémantického Webu
Jiří Kosek Re: Úvod do Sémantického Webu
jehovista Re: Úvod do Sémantického Webu
mm Re: Úvod do Sémantického Webu
Jakub Galgonek Re: Úvod do Sémantického Webu
Jiří Kosek Re: Úvod do Sémantického Webu
Jakub Galgonek Re: Úvod do Sémantického Webu
Jiří Kosek Re: Úvod do Sémantického Webu
campula Re: Úvod do Sémantického Webu
Jiří Procházka Re: Úvod do Sémantického Webu
Jakub Galgonek Re: Úvod do Sémantického Webu
Jiří Procházka Re: Úvod do Sémantického Webu
Me Re: Úvod do Sémantického Webu
Jakub Galgonek Re: Úvod do Sémantického Webu
Radek Burget Začněme od začátku
Daniela B. Re: Začněme od začátku
Jiří Procházka Re: Začněme od začátku
Pavel Ptáček Re: Začněme od začátku
Ekkys Re: Začněme od začátku
paranoiq Re: Začněme od začátku
Inkvizitor Díky za článek
Inkvizitor Re: Díky za článek
Reypall Sémantický web a Linked Data
Trm Semanciky web je jen modni slovo
Tvrdá pěst akademické třídy Re: Semanciky web je jen modni slovo
Tvrdá pěst akademické třídy Re: Semantiky web je jen modni slovo
Jakub Galgonek Re: Semantiky web je jen modni slovo
Tvrdá pěst akademické třídy Re: Semantiky web je jen modni slovo
Jakub Galgonek Re: Semantiky web je jen modni slovo
Zdroj: https://www.zdrojak.cz/?p=3111