draft:technicke-standardy-pro-datove-sady-na-stupni-3

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revize Předchozí verze
Následující verze
Předchozí verze
Poslední revizeObě strany příští revize
draft:technicke-standardy-pro-datove-sady-na-stupni-3 [2018/06/25 14:00] Michal Meddraft:technicke-standardy-pro-datove-sady-na-stupni-3 [2018/07/30 20:09] Jakub Klímek
Řádek 1: Řádek 1:
 +<WRAP center round important 60%>
 +Tento draft je dále vyvíjen na [[https://data.gov.cz/otevřené-formální-normy/prostorová-data/draft/|https://data.gov.cz/otevřené-formální-normy/prostorová-data/draft/]].
 +</WRAP>
 +
  
 ==== Standardy pro prostorové datové sady ==== ==== Standardy pro prostorové datové sady ====
Řádek 8: Řádek 12:
 === Geometrické objekty === === Geometrické objekty ===
  
-Obecně je vhodné k vyjádření geometrického objektu používat interpretaci geometrických objektů tak, jak je definována v použitém formátu. Nejrozšířenější formáty pro zápis geometrických objektů WKT a GML.+Obecně je vhodné k vyjádření geometrického objektu používat interpretaci geometrických objektů tak, jak je definována v použitém formátu. Nejrozšířenější formáty pro zápis geometrických objektů jsou WKT a GML.
  
 **Well-Known Text (WKT)** -- formát byl vytvořen OGC a je specifikován ve standardech [[http://www.opengeospatial.org/standards/sfa|Simple Feature Access]] a ISO 19125. Je vhodný především k zápisu 2D geometrií, jako je point, multipoint, line, polyline, polygon a pod. Přestože je ve WKT možné definovat souřadnicové systémy a používat je pro reprezentované objekty, nejčastěji je WKT používán pro reprezentaci souřadnic v souřadnicovém systému WGS 84. **Well-Known Text (WKT)** -- formát byl vytvořen OGC a je specifikován ve standardech [[http://www.opengeospatial.org/standards/sfa|Simple Feature Access]] a ISO 19125. Je vhodný především k zápisu 2D geometrií, jako je point, multipoint, line, polyline, polygon a pod. Přestože je ve WKT možné definovat souřadnicové systémy a používat je pro reprezentované objekty, nejčastěji je WKT používán pro reprezentaci souřadnic v souřadnicovém systému WGS 84.
Řádek 67: Řádek 71:
    
 Datové sady prostorových dat by měly být publikovány ve vhodném otevřeném formátu, který musí umožnit strojovou čitelnost. Následuje seznam doporučených otevřených formátů: Datové sady prostorových dat by měly být publikovány ve vhodném otevřeném formátu, který musí umožnit strojovou čitelnost. Následuje seznam doporučených otevřených formátů:
- 
-    * [[https://cs.wikipedia.org/wiki/CSV|Comma Separated Values]] (CSV, IETF RFC4180) - tabulkový způsob zápisu vhodný pro nepříliš komplexní data. Jednotlivé záznamy atributové tabulky jsou zapsány jako řádky textového souboru a hodnoty záznamů jako řetězce oddělené čárkou (znak UTF-8 s kódem U+002C). Zápis geometrického objektu zpravidla obsahuje čárky, proto je vhodné hodnoty uzavřít do uvozovek (znak UTF-8 s kódem U+0022). Pro zápis prostorové informace je vhodné použít WKT. Data ve formátu CSV by měla obsahovat informaci o použitém souřadnicovém referenčním systému buď formou EPSG kódu, nebo URI (viz //Poznámka k souřadnicovým systémům//), buď v hlavičce souboru, nebo jako atribut. Data obsahující informace o ulicích s geometrií uliční čáry by mohly vypadat například takto: 
-<code>Kód,Název ulice,Kód Obce,Název Obce,Kód Okresu,Název Okresu,WKT_Geometry,CRS 
-442666,Adamovská,554782,Praha,3100,Hlavní město Praha,"LINESTRING(14.450325965881346 50.05789646795757, 14.450948238372803 50.05791713211645, 14.45121645927429 50.05803422884852, 14.451420307159424 50.058764354966634, 14.451624155044554 50.0591569653608, 14.451828002929688 50.059460030836206, 14.45177435874939 50.059522021265785)",http://www.opengis.net/def/crs/EPSG/0/4258 
-442674,Africká,554782,Praha,3100,Hlavní město Praha,"LINESTRING(14.349464178085329 50.09616500163075, 14.349786043167112 50.096075528282334, 14.349968433380127 50.09575892893866, 14.350258111953734 50.09575892893866, 14.350826740264893 50.09566257220141, 14.352350234985352 50.09597228959578, 14.354592561721802 50.096399008059755, 14.355171918869019 50.096392125534024, 14.355483055114746 50.09633018275811, 14.355762004852295 50.09634394782634, 14.358251094818113 50.096791310391346, 14.358723163604736 50.096873899946615, 14.359141588211058 50.09697713669046, 14.359956979751587 50.09699778401253, 14.36085820198059 50.09715607985288, 14.362660646438599 50.09761031718664, 14.363701343536377 50.09788561044452, 14.363905191421507 50.09789937506589, 14.364173412322996 50.09786496350506, 14.364463090896606 50.09773419934845)",http://www.opengis.net/def/crs/EPSG/0/4258 
-442682,Akátová,554782,Praha,3100,Hlavní město Praha,"LINESTRING(14.41953420639038 50.077619800339754, 14.41979169845581 50.077647341221535, 14.421336650848389 50.07749586617591, 14.42479133605957 50.077330620125764, 14.429275989532469 50.07717914407949, 14.431657791137694 50.07711029117297)",http://www.opengis.net/def/crs/EPSG/0/4258 
-</code> 
  
     * [[http://www.opengeospatial.org/standards/gml|Geography Markup Language]] (OGC GML) - jedná se formát XML pro prostorová data. Geometrie je zapisována za použití GML. Jedná se o komplexní formát, který je schopen zápisu v podstatě libovolného typu geometrických objektů a atributových hodnot. Formát GML ve verzi 3.2.1 je používán pro datové sady publikované podle směrnice [[https://inspire.ec.europa.eu/|INSPIRE]]. K zápisu jsou používány dvojice tagů, jazyk XML je rozšířen o abstraktní typ AbstractFeatureType, který musí obsahovat geometrický objekt. Pro komplexní poskytování dat ve formátu GML je vhodné vytvořit schéma dokumentu v XML Schema Definition (XSD), které zajišťuje validitu dat. Data pro adresní místa publikovaná v rámci směrnice INSPIRE pro Českou republiku vypadají takto:     * [[http://www.opengeospatial.org/standards/gml|Geography Markup Language]] (OGC GML) - jedná se formát XML pro prostorová data. Geometrie je zapisována za použití GML. Jedná se o komplexní formát, který je schopen zápisu v podstatě libovolného typu geometrických objektů a atributových hodnot. Formát GML ve verzi 3.2.1 je používán pro datové sady publikované podle směrnice [[https://inspire.ec.europa.eu/|INSPIRE]]. K zápisu jsou používány dvojice tagů, jazyk XML je rozšířen o abstraktní typ AbstractFeatureType, který musí obsahovat geometrický objekt. Pro komplexní poskytování dat ve formátu GML je vhodné vytvořit schéma dokumentu v XML Schema Definition (XSD), které zajišťuje validitu dat. Data pro adresní místa publikovaná v rámci směrnice INSPIRE pro Českou republiku vypadají takto:
Řádek 162: Řádek 159:
 </code> </code>
     * [[http://www.opengeospatial.org/standards/geopackage|OGC GeoPackage]] - je nad souborovou databází [[https://www.sqlite.org/|SQLite]] postavený standardizovaný formát pro prostorová data. Lze do něj uložit stejnou  strukturu jako do CSV a složitou geometrickou strukturu jako samostatný atribut. Vzhledem ke své povaze umí GeoPackage spravovat mimo vektorových dat i rastrová data. Jedná se o souborovou databázi, takže zde není uveden příklad dat. Více informací je ve [[http://www.opengeospatial.org/standards/geopackage|standardu]] a na [[http://www.geopackage.org/guidance/getting-started.html|stránkách formátu]].     * [[http://www.opengeospatial.org/standards/geopackage|OGC GeoPackage]] - je nad souborovou databází [[https://www.sqlite.org/|SQLite]] postavený standardizovaný formát pro prostorová data. Lze do něj uložit stejnou  strukturu jako do CSV a složitou geometrickou strukturu jako samostatný atribut. Vzhledem ke své povaze umí GeoPackage spravovat mimo vektorových dat i rastrová data. Jedná se o souborovou databázi, takže zde není uveden příklad dat. Více informací je ve [[http://www.opengeospatial.org/standards/geopackage|standardu]] a na [[http://www.geopackage.org/guidance/getting-started.html|stránkách formátu]].
 +    * [[https://cs.wikipedia.org/wiki/CSV|Comma Separated Values]] (CSV, IETF RFC4180) - tabulkový způsob zápisu vhodný pro nepříliš komplexní data. Jednotlivé záznamy atributové tabulky jsou zapsány jako řádky textového souboru a hodnoty záznamů jako řetězce oddělené čárkou (znak UTF-8 s kódem U+002C). Zápis geometrického objektu zpravidla obsahuje čárky, proto je vhodné hodnoty uzavřít do uvozovek (znak UTF-8 s kódem U+0022). Pro zápis prostorové informace je vhodné použít WKT. Data ve formátu CSV by měla obsahovat informaci o použitém souřadnicovém referenčním systému buď formou EPSG kódu, nebo URI (viz //Poznámka k souřadnicovým systémům//), buď v hlavičce souboru, nebo jako atribut. Data obsahující informace o ulicích s geometrií uliční čáry by mohly vypadat například takto:
 +<code>Kód,Název ulice,Kód Obce,Název Obce,Kód Okresu,Název Okresu,WKT_Geometry,CRS
 +442666,Adamovská,554782,Praha,3100,Hlavní město Praha,"LINESTRING(14.450325965881346 50.05789646795757, 14.450948238372803 50.05791713211645, 14.45121645927429 50.05803422884852, 14.451420307159424 50.058764354966634, 14.451624155044554 50.0591569653608, 14.451828002929688 50.059460030836206, 14.45177435874939 50.059522021265785)",http://www.opengis.net/def/crs/EPSG/0/4258
 +442674,Africká,554782,Praha,3100,Hlavní město Praha,"LINESTRING(14.349464178085329 50.09616500163075, 14.349786043167112 50.096075528282334, 14.349968433380127 50.09575892893866, 14.350258111953734 50.09575892893866, 14.350826740264893 50.09566257220141, 14.352350234985352 50.09597228959578, 14.354592561721802 50.096399008059755, 14.355171918869019 50.096392125534024, 14.355483055114746 50.09633018275811, 14.355762004852295 50.09634394782634, 14.358251094818113 50.096791310391346, 14.358723163604736 50.096873899946615, 14.359141588211058 50.09697713669046, 14.359956979751587 50.09699778401253, 14.36085820198059 50.09715607985288, 14.362660646438599 50.09761031718664, 14.363701343536377 50.09788561044452, 14.363905191421507 50.09789937506589, 14.364173412322996 50.09786496350506, 14.364463090896606 50.09773419934845)",http://www.opengis.net/def/crs/EPSG/0/4258
 +442682,Akátová,554782,Praha,3100,Hlavní město Praha,"LINESTRING(14.41953420639038 50.077619800339754, 14.41979169845581 50.077647341221535, 14.421336650848389 50.07749586617591, 14.42479133605957 50.077330620125764, 14.429275989532469 50.07717914407949, 14.431657791137694 50.07711029117297)",http://www.opengis.net/def/crs/EPSG/0/4258
 +</code>
     * [[https://www.esri.com/library/whitepapers/pdfs/shapefile.pdf|ESRI Shapefile]] - je poměrně zastaralý, přesto stále hojně používaný formát pro správu prostorových dat vyvinutý společností ESRI, která uvolnila [[https://www.esri.com/library/whitepapers/pdfs/shapefile.pdf|technickou dokumentaci]] formátu. Jedná se o otevřený formát, který uchovává informace ve více souborech. Vlastnosti jednotlivých prvků dodržují strukturu pro datovou sadu. Organizace spravující data prostřednictvím software od společnosti ESRI by s publikací dat v tomto formátu neměly mít problémy.     * [[https://www.esri.com/library/whitepapers/pdfs/shapefile.pdf|ESRI Shapefile]] - je poměrně zastaralý, přesto stále hojně používaný formát pro správu prostorových dat vyvinutý společností ESRI, která uvolnila [[https://www.esri.com/library/whitepapers/pdfs/shapefile.pdf|technickou dokumentaci]] formátu. Jedná se o otevřený formát, který uchovává informace ve více souborech. Vlastnosti jednotlivých prvků dodržují strukturu pro datovou sadu. Organizace spravující data prostřednictvím software od společnosti ESRI by s publikací dat v tomto formátu neměly mít problémy.
  
Řádek 190: Řádek 193:
 === Metadata === === Metadata ===
  
-Kromě smotných dat je vhodné poskytovat i metadata -- data o datech. Pro soulad se stupněm otevřenosti 3 to ale není nezbytné. Pro popis prostorových dat se běžně používá meatadový standard dle normy [[https://www.iso.org/standard/26020.html|ISO 19115]]. Mezi základní poskytované informace patří poskytovatel dat a kontakt na něj, informace o aktuálnosti a úplnosti dat, o jejich územním rozsahu, o způsobech publikace a licenci nebo o kvalitě těchto dat. +Kromě smotných dat je vhodné poskytovat i metadata -- data o datech. Pro soulad se stupněm otevřenosti 3 to ale není nezbytné. Pro popis prostorových dat se běžně používá metadový standard dle normy [[https://www.iso.org/standard/26020.html|ISO 19115]]. Mezi základní poskytované informace patří poskytovatel dat a kontakt na něj, informace o aktuálnosti a úplnosti dat, o jejich územním rozsahu, o způsobech publikace a licenci nebo o kvalitě těchto dat. 
  
 V případě poskytování dat pomocí OGC standardizovaných služeb je vhodné poskytovat i metadata o těchto službách (např. podle standardu [[https://www.iso.org/standard/59221.html|ISO 19119]]). Pro poskytování a vyhledávání metadat existuje služba [[http://www.opengeospatial.org/standards/csw|OGC CSW]], která spravuje poskytování metadatových záznamů a umožňuje vyhledávání datových sad a služeb na základě jejich metadat.  V případě poskytování dat pomocí OGC standardizovaných služeb je vhodné poskytovat i metadata o těchto službách (např. podle standardu [[https://www.iso.org/standard/59221.html|ISO 19119]]). Pro poskytování a vyhledávání metadat existuje služba [[http://www.opengeospatial.org/standards/csw|OGC CSW]], která spravuje poskytování metadatových záznamů a umožňuje vyhledávání datových sad a služeb na základě jejich metadat. 
 +
 +V případě tvorby metadat dle norem ISO 19115 a 19119 je vhodné použít český metadatový profil, který mimo jiné definuje položku o otevřenosti dat.
  
 === INSPIRE === === INSPIRE ===