Sémantický web 6. díl, Sémantika a Web 2.0

« zpět na sémantický web

Vyhledávání - Web 2.0



Sémantický web - vyhledávací stroje

Vyhledávací stroje jakpro sémantický web, tak pro „normální“ web jsou si na nejvyšší úrovni velmi podobné: získávání a vytěžování dokumentů; zpracování dotazů od uživatelů a agentů; řazení výsledků vyhledávání; archivace dokumentů; nabízet rozhraní jak pro uživatele, tak aplikační rozhraní pro software.

Odlišnosti vyhledávání v sémantickém webu mají více příčin:

  • Posláním sémantického webu je mj. strojové zpracování obsahu, proto použité značkování či anotování může dobře posloužit při konstrukci agentské vrstvy mezi uživatelem a vyhledávacím strojem.


  • Znalosti, které jsou zachyceny např. pomocí RDF, se liší jak od převážně nestrukturovaných dokumentů běžného webu, tak od dobře strukutovaných informací v databázích (např. relačního typu). Takto semistrukturované informace vyžadují kombinaci technik pro efektivní indexování a vyhledávání


  • Jeden dokument sémantického webu může být směsicí konkrétních faktů, tříd a definic vlastností, logických omezení a metadat. Plné porozumění dokumentu pak vyžaduje určitou míru odvozování, což je nutně vyžadováno také od vyhledávacího stroje. Toto odvozování může produkovat nová fakta, omezení a metadata, která mohou být přínosná pro indexování. Konvenční vyhledávací stroje se o porozumění obsahu dokumentů nesnaží, protože se jedná o obtížnou úlohu a vyžaduje výzkum v oblasti porozumění textu.


  • Významně se rovněž liší struktura grafu, která je daná kolekcí dokumentů tvořících sémantický web, od grafu plynoucího z hypertextových odkazů běžných webových dokumentů. Tento rozdíl ovlivňuje jak strategii pro automatizované získávání dokumentů, tak způsob určení metrik pro řazení jejich významnosti.




  • Při vyhledávání porovnává vyhledávací stroj dotazy vůči datům, která vzešla z indexování. Zatímco výsledkem u webových vyhledávacích strojů jsou dokumenty, výsledky vyhledávací stroje sémantického webu mohou poskytovat i více než prostý dokument – lze agregovat data na více úrovních, počínaje univerzálním grafem všech RDF dat na webu až k jednotlivému RDF tripletu

    Autor: Radim Gál

    Klientská sekce pro Vás

    Spravujte své domény a hosting pohodlně 24 hodin denně

    Kontakt pro zákazníky

    Technická podpora

    PO-PÁ 8:00-18:00

    E-mail: podpora@banan.cz 

    Příjem dotazů probíhá NONSTOP

    Online pracovník

    Richard Slipek

    +420 608 611 883

    Online chat

    Zvládáme opensource

    Na našich serverech jsme ručně ověřili funkci více než 140 opensource systémů, některé z nich nabízíme na jedno kliknutí v administraci.

    Hostované domény

    6684 domén 5601 1083

    Poslední článek - HOMEPAGE PRVKY

    O
    Ověřit dostupnost domény
    Zákaznické centrum: podpora@banan.cz +420 608 611 883 (PO-PÁ 8:00-18:00)NápovědaBlog
    Technická podpora: PO-PÁ 800-1800X
    Online pracovník: Richard Slipek
    podpora@banan.cz
    Online chat nebo +420 608 611 883
    Kontaktovat technickou podporu můžete zde
    Kontaktovat technickou podporu můžete zde
    PO-PÁ 800-1800