Sémantický web 6. díl, Sémantika a Web 2.0

« zpět na sémantický web

Vyhledávání - Web 2.0Sémantický web - vyhledávací stroje

Vyhledávací stroje jakpro sémantický web, tak pro „normální“ web jsou si na nejvyšší úrovni velmi podobné: získávání a vytěžování dokumentů; zpracování dotazů od uživatelů a agentů; řazení výsledků vyhledávání; archivace dokumentů; nabízet rozhraní jak pro uživatele, tak aplikační rozhraní pro software.

Odlišnosti vyhledávání v sémantickém webu mají více příčin:

 • Posláním sémantického webu je mj. strojové zpracování obsahu, proto použité značkování či anotování může dobře posloužit při konstrukci agentské vrstvy mezi uživatelem a vyhledávacím strojem.


 • Znalosti, které jsou zachyceny např. pomocí RDF, se liší jak od převážně nestrukturovaných dokumentů běžného webu, tak od dobře strukutovaných informací v databázích (např. relačního typu). Takto semistrukturované informace vyžadují kombinaci technik pro efektivní indexování a vyhledávání


 • Jeden dokument sémantického webu může být směsicí konkrétních faktů, tříd a definic vlastností, logických omezení a metadat. Plné porozumění dokumentu pak vyžaduje určitou míru odvozování, což je nutně vyžadováno také od vyhledávacího stroje. Toto odvozování může produkovat nová fakta, omezení a metadata, která mohou být přínosná pro indexování. Konvenční vyhledávací stroje se o porozumění obsahu dokumentů nesnaží, protože se jedná o obtížnou úlohu a vyžaduje výzkum v oblasti porozumění textu.


 • Významně se rovněž liší struktura grafu, která je daná kolekcí dokumentů tvořících sémantický web, od grafu plynoucího z hypertextových odkazů běžných webových dokumentů. Tento rozdíl ovlivňuje jak strategii pro automatizované získávání dokumentů, tak způsob určení metrik pro řazení jejich významnosti.
 • Při vyhledávání porovnává vyhledávací stroj dotazy vůči datům, která vzešla z indexování. Zatímco výsledkem u webových vyhledávacích strojů jsou dokumenty, výsledky vyhledávací stroje sémantického webu mohou poskytovat i více než prostý dokument – lze agregovat data na více úrovních, počínaje univerzálním grafem všech RDF dat na webu až k jednotlivému RDF tripletu

  Autor: Radim Gál

  Klientská sekce pro Vás

  Spravujte své domény a hosting pohodlně 24 hodin denně

  Kontakt pro zákazníky

  Technická podpora

  PO-PÁ 8:00-18:00

  E-mail: podpora@banan.cz 

  Příjem dotazů probíhá NONSTOP

  Online pracovník

  Richard Slipek

  +420 608 611 883

  Online chat

  Zvládáme opensource

  Na našich serverech jsme ručně ověřili funkci více než 140 opensource systémů, některé z nich nabízíme na jedno kliknutí v administraci.

  Hostované domény

  6684 domén 5601 1083

  Poslední článek - HOMEPAGE PRVKY

  O
  Ověřit dostupnost domény
  Zákaznické centrum: podpora@banan.cz +420 608 611 883 (PO-PÁ 8:00-18:00)NápovědaBlog
  Technická podpora: PO-PÁ 800-1800X
  Online pracovník: Richard Slipek
  podpora@banan.cz
  Online chat nebo +420 608 611 883
  Kontaktovat technickou podporu můžete zde
  Kontaktovat technickou podporu můžete zde
  PO-PÁ 800-1800