Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Následující verze
Předchozí verze
špatná-praxe:špatné-dělení-distribucí [2019/07/17 10:17] – vytvořeno Jakub Klímekšpatná-praxe:špatné-dělení-distribucí [2022/02/10 13:34] (aktuální) Jakub Klímek
Řádek 6: Řádek 6:
 Distribuce v neotevřených či strojově nečitelných formátech je možné v NKOD mít, ale pouze v případě, že datová sada obsahuje i otevřenou a strojově čitelnou distribuci. Distribuce v neotevřených či strojově nečitelných formátech je možné v NKOD mít, ale pouze v případě, že datová sada obsahuje i otevřenou a strojově čitelnou distribuci.
  
-Metadata datové sady se řídí doporučením W3C, tedy webovým standardem, [[https://www.w3.org/TR/vocab-dcat/|DCAT - Data Catalog Vocabulary]], a jeho aplikačním profilem pro Evropu [[https://joinup.ec.europa.eu/release/dcat-ap/121|DCAT-AP]].+Metadata datové sady se řídí [[https://ofn.gov.cz/rozhraní-katalogů-otevřených-dat/2021-01-11/|Otevřenou formální normou Rozhraní katalogů otevřených dat - DCAT-AP-CZ]], která je založena na doporučení W3C, tedy webovém standardu, [[https://www.w3.org/TR/vocab-dcat/|DCAT - Data Catalog Vocabulary]], a jeho aplikačním profilu pro Evropu [[https://joinup.ec.europa.eu/collection/semantic-interoperability-community-semic/solution/dcat-application-profile-data-portals-europe|DCAT-AP]].
 Ten určuje základní strukturu katalogizačního záznamu. Ten určuje základní strukturu katalogizačního záznamu.
 Část popisu dat která je nezávislá na konkrétním technickém provedení přístupu k datům, jako třeba název, popis, periodicita aktualizace, klíčová slova, prostorové a časové pokrytí, apod. patří na úroveň datové sady. Část popisu dat která je nezávislá na konkrétním technickém provedení přístupu k datům, jako třeba název, popis, periodicita aktualizace, klíčová slova, prostorové a časové pokrytí, apod. patří na úroveň datové sady.
Řádek 14: Řádek 14:
  
 ===== Chybný příklad 1: Dělení do distribucí dle času, místa, oddělení apod. ===== ===== Chybný příklad 1: Dělení do distribucí dle času, místa, oddělení apod. =====
-Datová sada: ''Faktury'' +**Datová sada**: ''Faktury''
-Jednotlivé distribuce: ''Faktury 2014'', ''Faktury 2015'', ''Faktury 2016'' apod.+
  
-Způsobený problém: Uživatel hledající data za rok 2014 tuto datovou sadu nenajde. Vyhledávání totiž typicky probíhá podle metadat datové sady. U distribuce ''Faktury 2014'' ani žádná metadata o časovém pokrytí NKOD neeviduje - eviduje je u datové sady. +**Jednotlivé distribuce**: ''Faktury 2014'', ''Faktury 2015'', ''Faktury 2016'' apod.
-Řešení: Každá z distribucí ve skutečnosti reprezentuje samostatnou datovou sadu. Časové pokrytí či prostorové pokrytí jsou části metadat datové sady.+
  
-Další špatné příklady: +**Způsobený problém**Uživatel hledající data za rok 2014 tuto datovou sadu nenajdeVyhledávání totiž typicky probíhá podle metadat datové sadyU distribuce ''Faktury 2014'' ani žádná metadata o časovém pokrytí NKOD neeviduje eviduje je u datové sady. 
-  [[https://data.gov.cz/datová-sada?iri=https://data.gov.cz/zdroj/datové-sady/http---datahub.io-api-3-action-package_show-id-2ef3ec2c-a70f-416d-9915-35fa7341b944|Poskytnuté záštity města (Statutární město Hradec Králové)]] + 
-  [[https://data.gov.cz/datová-sada?iri=https://data.gov.cz/zdroj/datové-sady/https---kod.brno.cz-api-action-package_show-id-aplikace-sako-nahlasovani-preplnenych-kontejneru|Aplikace SAKO - nahlašování přeplněných kontejnerů (Statutární město Brno)]]+**Řešení**: Každá z distribucí ve skutečnosti reprezentuje samostatnou datovou saduČasové pokrytí či prostorové pokrytí jsou části metadat datové sadyTedy správně by byly datové sady ''Faktury 2014'', ''Faktury 2015'' a ''Faktury 2016'', kde každá z nich bude mít distribuce v jednom či více formátech (RDF Turtle, JSON, XML, CSV...)
  
 ===== Chybný příklad 2: Zneužívání datové sady pro seskupování různých souborů ===== ===== Chybný příklad 2: Zneužívání datové sady pro seskupování různých souborů =====
-Datová sada: ''Informace o turistických cílech'' +**Datová sada**: ''Informace o turistických cílech''
-Jednotlivé distribuce: ''Hrady'', ''Zámky'', ''Infocentra'' apod.+
  
-Problém: Dle metadat (krom názvu distribuce) nelze zjistit, která distribuce obsahuje co. Tyto informace musí být na úrovni datové sady. +**Jednotlivé distribuce**''Hrady''''Zámky''''Infocentra'' apod.
-ŘešeníKaždá z distribucí ve skutečnosti reprezentuje samostatnou datovou sadu. Každá je o jiném typu objektua to se musí projevit minimálně i v názvupopisu a klíčových slovech dané datové sady.+
  
-Další špatné příklady: +**Způsobený problém**Dle metadat (krom názvu distribuce) nelze zjistit, která distribuce obsahuje coTyto informace musí být na úrovni datové sady. 
-  [[https://data.gov.cz/datová-sada?iri=https://data.gov.cz/zdroj/datové-sady/ZmmerickyU/671715799|Data200 (Zeměměřický úřad)]]+ 
 +**Řešení**Každá z distribucí ve skutečnosti reprezentuje samostatnou datovou saduKaždá je o jiném typu objektu, a to se musí projevit minimálně i v názvu, popisu a klíčových slovech dané datové sady.
  
 ===== Správný příklad ===== ===== Správný příklad =====
-Datová sada: ''Agendy'' +**Datová sada**: ''Agendy'' 
-Jednotlivé distribuce: ''JSON'', ''JSON-LD'', případně ''XML'', ''CSV'', ''XLSX'' apod.+ 
 +**Jednotlivé distribuce**: ''JSON'', ''JSON-LD'', případně ''XML'', ''CSV'', ''XLSX'' apod.
  
 V každé distribuci je věcně stejný obsah. Liší se jen datový formát. V každé distribuci je věcně stejný obsah. Liší se jen datový formát.
 +Speciálním případem mohou být distribuce, které mají sice stejný formát, ale liší se vnitřní strukturou - schématem.
 +Tedy třeba XML dle 2 různých XSD v případě, že pro jedna data existují 2 standardy.
  
  • špatná-praxe/špatné-dělení-distribucí.1563351423.txt.gz
  • Poslední úprava: 2020/06/03 09:36
  • (upraveno mimo DokuWiki)