standardy:stupne-otevrenosti

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Následující verze
Předchozí verze
Poslední revizeObě strany příští revize
standardy:stupne-otevrenosti [2017/07/11 15:04] tomas.pechastandardy:stupne-otevrenosti [2018/09/18 06:28] – [Stupeň otevřenosti 5] Jakub Klímek
Řádek 4: Řádek 4:
  
 {{ :standardy:5star-steps.png?600 |}} {{ :standardy:5star-steps.png?600 |}}
-Převzato z [[http://5stardata.info]]+Převzato z [[https://5stardata.info/cs]]
  
   * stupeň 1 - datová je dostupná v síti WWW s vhodnými podmínkami užití otevřených dat (viz [[cinnost:stanoveni-podminek-uziti|Jak stanovit podmínky užití datových sad?]]),   * stupeň 1 - datová je dostupná v síti WWW s vhodnými podmínkami užití otevřených dat (viz [[cinnost:stanoveni-podminek-uziti|Jak stanovit podmínky užití datových sad?]]),
Řádek 12: Řádek 12:
   * stupeň 5 - datová sada splňuje standard propojených dat.   * stupeň 5 - datová sada splňuje standard propojených dat.
  
-Datová sada je tvořena sadou spolu souvisejících údajů. Při jejím zveřejňování v síti WWW je typicky distribuována zájemcům v podobě souborů ke stažení, které nazýváme **distribuce datové sady**. Distribucí datové sady může být více. Pokud je obsah datové sady příliš velký, je možné jej rozdělit do několika distribucí. Nebo může mít smysl poskytnout obsah datové sady ve více formátech. Je tedy např. možné poskytnout distribuci datové sady ve formátu XLS a jinou distribuci ve formátu CSV. První formát je vhodný pro analytiky, kteří chtějí s údaji pracovat ve svém tabulkovém editoru. Druhý formát je vhodný pro programátory, kteří chtějí údaje automatizovaně převádět do svojí databáze, nad kterou budují svojí softwarovou aplikaci+Datová sada je tvořena údaji, které spolu souvisí. Při jejím zveřejňování v síti WWW musí být distribuována zájemcům v podobě souboru ke stažení, které nazýváme **distribuce datové sady**. Distribucí datové sady může být více. Všechny distribuce jedné datové sady ale musí mít stejný obsah. Mohou se lišit pouze ve formátu. Je tedy např. možné poskytnout distribuci datové sady ve formátu XLS a jinou distribuci ve formátu CSV. První formát je vhodný pro analytiky, kteří chtějí s údaji pracovat ve svém tabulkovém editoru. Druhý formát je vhodný pro programátory, kteří chtějí údaje automatizovaně převádět do svojí databáze, nad kterou budují svojí softwarovou aplikaci.
- +
-Vždy platí, že se snažíme poskytnout jednu distribuci s celým obsahem datové sady a v pravidelných periodách ji nahrazovat novou distribucí vždy s aktuálním obsahem. Je to nejvhodnější způsob publikace pro uživatele, kteří potřebují pracovat s obsahem datové sady jako s jedním celkem. Není vhodné např. pro každý záznam v datové sadě poskytovat jednu distribuci, kterou lze stáhnout jedině tak, že uživatel zná identifikátor záznamu a ten použije jako hodnotu parametru v odkazu na distribuci. Takový přístup je příliš komplikovaný a získání celého obsahu datové sady je velmi složité a neefektivní jak pro uživatele tak poskytovatele dat. Pouze u velkých datových sad je možné rozdělit jejich obsah do více distribucí z důvodů jejich neúměrné velikosti. Případně u datových sad, kde je důležité přesně informovat o provedených změnách je doporučováno zveřejnit jednu distribuci s iniciálním obsahem datové sady a poté zveřejňovat distribuce se seznamem provedených změn (tj. jaké záznamy byly smazány a jaké byly vytvořeny či aktualizovány a jak).+
  
 +Pokud je obsah datové sady příliš velký, je možné jej rozdělit do více datových sad. Každá pak bude mít svoje distribuce, které se liší pouze ve formátu. U datových sad, kde je důležité přesně informovat o provedených změnách, je doporučováno zveřejnit datovou s iniciálním obsahem a poté zveřejňovat datovou sadu se seznamem provedených změn (tj. jaké záznamy byly smazány a jaké byly vytvořeny či aktualizovány a jak). Dělení na menší datové sady ale není možné provádět tak, že jako jednotlivé datové sady poskytujeme jednotlivé záznamy. Při určování toho, co je datová sada, se vždy řídíme pravidlem, že datová sada je taková sada údajů, kterou chtějí naši uživatelé získat jako jeden celek, tj. získat v jednom souboru ke stažení. Tento celek je možné z důvodů velikosti rozdělit, ale vždy na co nejmenší nutný počet částí.
 ===== Specifikace stupňů otevřenosti datových sad ===== ===== Specifikace stupňů otevřenosti datových sad =====
  
Řádek 49: Řádek 48:
 ==== Stupeň otevřenosti 3 ==== ==== Stupeň otevřenosti 3 ====
  
-Stupeň otevřenosti 3 oproti stupni 2 navíc vyžaduje, aby specifikace formátu, ve kterém je distribuce datové sady vyjádřena, byla otevřená. Tzn.aby byla vyhledatelná a zdarma dostupná v síti WWW a aby existovaly volně dostupné programovací nástroje pro jejich zpracování (tj. knihovny apod.). Příkladem mohou být např. formáty definované v podobě RFC (např. formát CSV, který je definovaný v RFC 4180) nebo formáty definované konsorciem WWW (např. formát XML, který je definovaný v W3C Recommendation Extensible Markup Language (XML) 1.0 (Fifth Edition).+Stupeň otevřenosti 3 oproti stupni 2 navíc vyžaduje, aby specifikace formátu, ve kterém je distribuce datové sady vyjádřena, byla otevřená. Tzn.aby byla vyhledatelná a zdarma dostupná v síti WWW a aby existovaly volně dostupné programovací nástroje pro jejich zpracování (tj. knihovny apod.). Příkladem mohou být např. formáty definované v podobě RFC (např. formát CSV, který je definovaný v RFC 4180) nebo formáty definované konsorciem WWW (např. formát XML, který je definovaný v W3C Recommendation Extensible Markup Language (XML) 1.0 (Fifth Edition).
  
 V distribuci datové sady mohou být vyjádřeny pouze údaje tvořící datovou sadu a konstrukce vyjadřující jejich typ či sémantiku (sémantiku vyjadřuje např. hlavička tabulky v CSV souboru nebo XML tagy a atributy v XML elementu ohraničující údaj s určitým významem). Do distribuce datové sady nepatří konstrukce vyjadřující formátování (barvy nebo styl písma, v tabulkových datových sadách pak navíc ohraničení či slučování buněk, atd.), konstrukce s grafickými prvky, které nejsou součástí údajů v datové sadě, apod. V distribuci datové sady mohou být vyjádřeny pouze údaje tvořící datovou sadu a konstrukce vyjadřující jejich typ či sémantiku (sémantiku vyjadřuje např. hlavička tabulky v CSV souboru nebo XML tagy a atributy v XML elementu ohraničující údaj s určitým významem). Do distribuce datové sady nepatří konstrukce vyjadřující formátování (barvy nebo styl písma, v tabulkových datových sadách pak navíc ohraničení či slučování buněk, atd.), konstrukce s grafickými prvky, které nejsou součástí údajů v datové sadě, apod.
Řádek 57: Řádek 56:
 Do stupně otevřenosti 3 spadají formáty kancelářských aplikací s otevřenou specifikací (např. formáty Office Open XML či OpenDocument). Distribuce datových sad vyjádřené v těchto formátech však mohou obsahovat pouze údaje tvořící datovou sadu, nikoliv instrukce, které definují jejich formátování při zobrazování na obrazovce či tisku. Do stupně otevřenosti 3 spadají formáty kancelářských aplikací s otevřenou specifikací (např. formáty Office Open XML či OpenDocument). Distribuce datových sad vyjádřené v těchto formátech však mohou obsahovat pouze údaje tvořící datovou sadu, nikoliv instrukce, které definují jejich formátování při zobrazování na obrazovce či tisku.
  
-Pro prostorová data je vhodné zvolit některý z otevřených formátů OGC (Open Geospatial Consortium), jako je [[http://opengeospatial.org/standards/gml|GML]], [[http://opengeospatial.org/standards/kml|KML]] nebo [[http://opengeospatial.org/standards/geopackage|GeoPackage]].+Pro prostorová data je vhodné zvolit některý z otevřených formátů OGC (Open Geospatial Consortium), jako je [[http://opengeospatial.org/standards/gml|GML]], [[http://http://geojson.org/|GeoJSON]] nebo [[http://opengeospatial.org/standards/geopackage|GeoPackage]]. Pro reprezentaci prostorové složky dat je vhodné využít prostorových objektů v některém ze základních formátů, například GML nebo WKT. Více podrobností je [[https://opendata.gov.cz/draft:technicke-standardy-pro-datove-sady-na-stupni-3|v technickém standardu pro poskytování prostorových dat na stupni otevřenosti 3]].
  
 Za otevřený a pro některé typy dat i vhodný formát můžeme považovat proprietární ESRI Shapefile (firma ESRI neklade žádná licenční omezení na jeho použití) nebo komunitní GeoJSON (ten zatím nebyl žádným oficiálním orgánem standardizován). Oba tyto formáty mají širokou podporu v dalších softwarech, nejsou ale vhodné na všechny typy datových sad. Za otevřený a pro některé typy dat i vhodný formát můžeme považovat proprietární ESRI Shapefile (firma ESRI neklade žádná licenční omezení na jeho použití) nebo komunitní GeoJSON (ten zatím nebyl žádným oficiálním orgánem standardizován). Oba tyto formáty mají širokou podporu v dalších softwarech, nejsou ale vhodné na všechny typy datových sad.
 +
 +<WRAP center round tip 60%>
 +[[standardy:technicke-standardy-pro-datove-sady-na-stupni-3|Technické standardy pro datové sady na stupni otevřenosti 3]]
 +</WRAP>
  
  
Řádek 69: Řádek 72:
  
 Stupeň otevřenosti 5 je nejvyšším stupněm otevřenosti. Dále rozšiřuje stupeň 4. Vyžaduje, aby distribuce splňovala standardy propojených dat (angl. Linked Data). Standardy propojených dat jsou postaveny nad dobře známými standardy sítě WWW a umožňují vyjadřovat souvislosti mezi různými datovými sadami v podobě strojově zpracovatelných odkazů, které se podobají hypertextovým odkazům v síti WWW. Stupeň otevřenosti 5 je nejvyšším stupněm otevřenosti. Dále rozšiřuje stupeň 4. Vyžaduje, aby distribuce splňovala standardy propojených dat (angl. Linked Data). Standardy propojených dat jsou postaveny nad dobře známými standardy sítě WWW a umožňují vyjadřovat souvislosti mezi různými datovými sadami v podobě strojově zpracovatelných odkazů, které se podobají hypertextovým odkazům v síti WWW.
 +
 +<WRAP center round tip 60%>
 +[[https://data.gov.cz/otevřené-formální-normy/propojená-data/|Otevřená formální norma pro Propojená data]].
 +</WRAP>
  
 ===== Stupně otevřenosti v kontextu veřejné správy České republiky ===== ===== Stupně otevřenosti v kontextu veřejné správy České republiky =====
Řádek 79: Řádek 86:
  
 Dále je možné, aby poskytovatel provozoval nad svými otevřenými daty nějakou webovou, mobilní či jinou softwarovou aplikaci, která data zpřístupňují široké veřejnosti (kterou často nezajímají strojově čitelná data, ale právě aplikace nad nimi vytvořené). Existence nebo neexistence takových aplikací však nijak neovlivňuje otevřenost datové sady. Tj. pokud poskytovatel dat provozuje pouze takovou aplikaci (např. HTML formulář pro vyhledávání záznamů a jejich následné zobrazení) a neposkytuje kompletní obsah datové sady na stupni otevřenosti 3, neposkytuje otevřená data.  Dále je možné, aby poskytovatel provozoval nad svými otevřenými daty nějakou webovou, mobilní či jinou softwarovou aplikaci, která data zpřístupňují široké veřejnosti (kterou často nezajímají strojově čitelná data, ale právě aplikace nad nimi vytvořené). Existence nebo neexistence takových aplikací však nijak neovlivňuje otevřenost datové sady. Tj. pokud poskytovatel dat provozuje pouze takovou aplikaci (např. HTML formulář pro vyhledávání záznamů a jejich následné zobrazení) a neposkytuje kompletní obsah datové sady na stupni otevřenosti 3, neposkytuje otevřená data. 
 +
 +Za otevřená data se nepovažuje webová služba (nebo obecně API), která umožňuje získávat jednotlivé záznamy tvořící datovou sadu. Především proto, že účelem otevřených dat je poskytovat kompletní obsah a ne jednotlivé záznamy. Poskytovatel dat ve veřejné správě typicky nedisponuje infrastrukturou s takovou kapacitou, aby umožnil všem zájemcům o data získat kompletní obsah datové sady prostřednictvím takové webové služby. Je tak nucen omezovat počet přístupů k webové službě v čase, což je v přímém rozporu s podstatou otevřených dat. Poskytování otevřených dat není v rozporu s poskytováním dat prostřednictvím webových služeb, tyto přístupy se mohou vhodně doplňovat a mohou vedle sebe koexistovat. Není ale možné v žádném případě označovat takovou webovou službu jako otevřená data. 
  
 Z hlediska prostorových dat je zásadní zákon 123/1998 Sb. o právu na informace o životním prostředí, který zajišťuje transpozici evropské Směrnice INSPIRE do české legislativy. Směrnice INSPIRE se zabývá standardizací prostorových dat v Evropě, určuje jejich strukturu, definuje způsob jejich publikace a usnadňuje jejich vyhledávání prostřednictvím vyhledávací služby nad katalogem metadatových záznamů. Z hlediska prostorových dat je zásadní zákon 123/1998 Sb. o právu na informace o životním prostředí, který zajišťuje transpozici evropské Směrnice INSPIRE do české legislativy. Směrnice INSPIRE se zabývá standardizací prostorových dat v Evropě, určuje jejich strukturu, definuje způsob jejich publikace a usnadňuje jejich vyhledávání prostřednictvím vyhledávací služby nad katalogem metadatových záznamů.