Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
Předchozí verze | |||
— | standardy:technicke-standardy-pro-vytvareni-datovych-schemat-na-stupni-5 [2020/06/03 09:37] (aktuální) – upraveno mimo DokuWiki 127.0.0.1 | ||
---|---|---|---|
Řádek 1: | Řádek 1: | ||
+ | ====== Technické standardy vytváření datových schémat pro datové sady na stupni otevřenosti 5 ====== | ||
+ | Obdobou datového schématu pro datové sady na stupni otevřenosti 5 jsou tzv. ontologie (někdy též zvané slovníky). Zatímco však ve světě tabulkových či XML dat popisuje datové schéma striktní syntaxi např. CSV či XML distribucí datových sad, ontologie popisuje datovou sadu na konceptuální úrovni. Konkrétně definuje třídy a vlastnosti, které lze v RDF distribucích datových sad použít. | ||
+ | |||
+ | ===== Standardy pro vyjádření a zápis ontologií ===== | ||
+ | Standardem pro zápis ontologií jsou jazyky RDF Schema (RDFS, http:// | ||
+ | |||
+ | ===== Standardy pro tvorbu ontologií ===== | ||
+ | |||
+ | Primárním cílem při návrhu tříd a vlastností použitých v RDF distribuci datové sady musí být maximální znovupoužitelnost údajů v distribuci napříč různými SW aplikacemi. Proto je standardem co nejvíce využívat tříd a vlastností z již existujících ontologií. Datový model RDF je připraven k tomu, aby bylo možné v jedné RDF distribuci kombinovat třídy a vlastnosti z několika různých ontologií. V rámci různých iniciativ již vznikla v mezinárodním kontextu celá řada ontologií, které jsou katalogizovány např. v projektu Linked Open Vocabularies (LOV, http:// | ||
+ | |||
+ | Při návrhu tříd a vlastností použitých v RDF distribuci je proto standardem postupovat následovně: | ||
+ | |||
+ | * Identifikujeme typy entit vyskytujících se v datové sadě a jejich atributy a vztahy mezi nimi. (Jinými slovy tvoříme konceptuální schéma datové sady.) | ||
+ | * Vybereme třídy a vlastnosti definované existujícími ontologiemi, | ||
+ | * V případě, že se v kroku 2 nepodařilo pro některé typy entit, resp. jejich atributy nebo vztahy mezi nimi nalézt odpovídající třídy či vlastnosti z existujících ontologií, vybereme třídy a vlastnosti definované existujícími ontologiemi, | ||
+ | * V případě, že se v kroku 3 nepodařilo pro některé typy entit, resp. jejich atributy nebo vztahy mezi nimi nalézt třídy či vlastnosti z existujících ontologií s obecnější sémantikou, | ||
+ | * V případě, že po vypublikování RDF distribuce zjistíme, že jsme v kroku 2 udělali chybu a zavedli jsme třídu či vlastnost pro typ entity, resp. atribut či vztah, pro níž existuje sémantický ekvivalent v existující ontologii, nebo zjistíme, že se objevila nová ontologie s takovým sémantickým ekvivalentem, | ||
+ | * V případě, že po vypublikování RDF distribuce zjistíme, že jsme v kroku 3 udělali chybu a neidentifikovali jsme ISA vazbu, nebo se objevila nová ontologie pro kterou ISA vazba existuje, tuto ISA vazbu vytvoříme (pro technické vyjádření ISA vazby viz dále). | ||
+ | |||
+ | Standardem je využívání především následujících ontologií: | ||
+ | |||
+ | * DCMI Metadata Terms (http:// | ||
+ | * Simple Knowledge Organization System (http:// | ||
+ | * Schema.org (http:// | ||
+ | * Data Cube Vocabulary (http:// | ||
+ | * Friend-of-a-Friend (http:// | ||
+ | * The organization ontology (http:// | ||
+ | * FRBR-aligned bibliographic ontology (http:// | ||
+ | |||
+ | ===== Standardy propojování prvků ontologií ===== | ||
+ | |||
+ | Mezi prvky ontologií (tj. mezi třídami nebo mezi vlastnostmi) mohou existovat sémantické vazby. Může se jednat o vazby mezi prvky stejné ontologie nebo mezi prvky dvou různých ontologií. Tyto vazby je nutno v ontologiích vyjádřit. Vazbu vždy vyjádříme v ontologii, která definuje prvek, pro který chceme vazbu vyjádřit. Pro vyjádření vazby postupujeme podle následujícího standardu: | ||
+ | |||
+ | * pro vyjádření ISA vazby mezi třídami A a B, kdy třída A má specifičtější sémantiku a třída B má obecnější sémantiku, vytvoříme v zápisu ontologie následující trojici | ||
+ | * subjekt : IRI třídy A | ||
+ | * predikát : < | ||
+ | * objekt : IRI třídy B | ||
+ | * pro vyjádření ISA vazby mezi vlastnostmi A a B, kdy vlastnost A má specifičtější sémantiku a vlastnost B má obecnější sémantiku, vytvoříme v zápisu ontologie následující trojici | ||
+ | * subjekt : IRI vlastnosti A | ||
+ | * predikát : < | ||
+ | * objekt : IRI vlastnosti B | ||
+ | * pro vyjádření ekvivalenční vazby mezi třídami A a B, kdy sémantika třídy A je ekvivalentní sémantice třídy B, vytvoříme v zápisu ontologie následující trojici | ||
+ | * subjekt : IRI třídy A | ||
+ | * predikát : < | ||
+ | * objekt : IRI třídy B | ||
+ | * pro vyjádření ekvivalenční vazby mezi vlastnostmi A a B, kdy sémantika vlastnosti A je ekvivalentní sémantice vlastnosti B, vytvoříme v zápisu ontologie následující trojici | ||
+ | * subjekt : IRI vlastnosti A | ||
+ | * predikát : < | ||
+ | * objekt : IRI vlastnosti B | ||
+ | |||
+ | ===== Standardy tvorby IRI tříd a vlastností definovaných v ontologiích ===== | ||
+ | |||
+ | V případě, že poskytovatel dat definuje vlastní predikáty či třídy v podobě ontologie, potom pro ně musí volit IRI ve tvaru URL v následující podobě: | ||
+ | |||
+ | * v případě, že poskytovatel zavádí pouze jednu ontologii, má ontologie IRI ve tvaru '' | ||
+ | * v případě, že poskytovatel zavádí více ontologií, mají ontologie IRI ve tvaru '' | ||
+ | * třídy mají IRI ve tvaru '' | ||
+ | * predikáty mají IRI ve tvaru '' |