Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revize Předchozí verze
Následující verze
Předchozí verze
draft:technicke-standardy-pro-datove-sady-na-stupni-3 [2018/06/25 10:40]
Michal Med [Standardy pro prostorové datové sady]
draft:technicke-standardy-pro-datove-sady-na-stupni-3 [2018/07/30 20:09] (aktuální)
Jakub Klímek
Řádek 1: Řádek 1:
 +<WRAP center round important 60%>
 +Tento draft je dále vyvíjen na [[https://​data.gov.cz/​otevřené-formální-normy/​prostorová-data/​draft/​|https://​data.gov.cz/​otevřené-formální-normy/​prostorová-data/​draft/​]].
 +</​WRAP>​
 +
  
 ==== Standardy pro prostorové datové sady ==== ==== Standardy pro prostorové datové sady ====
Řádek 8: Řádek 12:
 === Geometrické objekty === === Geometrické objekty ===
  
-vyjádření geometrického objektu ​je vhodné ​používat ​buď WKTnebo GML interpretaci.+Obecně je vhodné k vyjádření geometrického objektu používat ​interpretaci geometrických objektů takjak je definována v použitém formátu. Nejrozšířenější formáty pro zápis geometrických objektů jsou WKT a GML.
  
 **Well-Known Text (WKT)** -- formát byl vytvořen OGC a je specifikován ve standardech [[http://​www.opengeospatial.org/​standards/​sfa|Simple Feature Access]] a ISO 19125. Je vhodný především k zápisu 2D geometrií, jako je point, multipoint, line, polyline, polygon a pod. Přestože je ve WKT možné definovat souřadnicové systémy a používat je pro reprezentované objekty, nejčastěji je WKT používán pro reprezentaci souřadnic v souřadnicovém systému WGS 84. **Well-Known Text (WKT)** -- formát byl vytvořen OGC a je specifikován ve standardech [[http://​www.opengeospatial.org/​standards/​sfa|Simple Feature Access]] a ISO 19125. Je vhodný především k zápisu 2D geometrií, jako je point, multipoint, line, polyline, polygon a pod. Přestože je ve WKT možné definovat souřadnicové systémy a používat je pro reprezentované objekty, nejčastěji je WKT používán pro reprezentaci souřadnic v souřadnicovém systému WGS 84.
Řádek 67: Řádek 71:
    
 Datové sady prostorových dat by měly být publikovány ve vhodném otevřeném formátu, který musí umožnit strojovou čitelnost. Následuje seznam doporučených otevřených formátů: Datové sady prostorových dat by měly být publikovány ve vhodném otevřeném formátu, který musí umožnit strojovou čitelnost. Následuje seznam doporučených otevřených formátů:
- 
-    * [[https://​cs.wikipedia.org/​wiki/​CSV|Comma Separated Values]] (CSV, IETF RFC4180) - tabulkový způsob zápisu vhodný pro nepříliš komplexní data. Jednotlivé záznamy atributové tabulky jsou zapsány jako řádky textového souboru a hodnoty záznamů jako řetězce oddělené čárkou (znak UTF-8 s kódem U+002C). Zápis geometrického objektu zpravidla obsahuje čárky, proto je vhodné hodnoty uzavřít do uvozovek (znak UTF-8 s kódem U+0022). Pro zápis prostorové informace je vhodné použít WKT. Data ve formátu CSV by měla obsahovat informaci o použitém souřadnicovém referenčním systému buď formou EPSG kódu, nebo URI (viz //Poznámka k souřadnicovým systémům//​),​ buď v hlavičce souboru, nebo jako atribut. Data obsahující informace o ulicích s geometrií uliční čáry by mohly vypadat například takto: 
-<​code>​Kód,​Název ulice,Kód Obce,Název Obce,Kód Okresu,​Název Okresu,​WKT_Geometry,​CRS 
-442666,​Adamovská,​554782,​Praha,​3100,​Hlavní město Praha,"​LINESTRING(14.450325965881346 50.05789646795757,​ 14.450948238372803 50.05791713211645,​ 14.45121645927429 50.05803422884852,​ 14.451420307159424 50.058764354966634,​ 14.451624155044554 50.0591569653608,​ 14.451828002929688 50.059460030836206,​ 14.45177435874939 50.059522021265785)",​http://​www.opengis.net/​def/​crs/​EPSG/​0/​4258 
-442674,​Africká,​554782,​Praha,​3100,​Hlavní město Praha,"​LINESTRING(14.349464178085329 50.09616500163075,​ 14.349786043167112 50.096075528282334,​ 14.349968433380127 50.09575892893866,​ 14.350258111953734 50.09575892893866,​ 14.350826740264893 50.09566257220141,​ 14.352350234985352 50.09597228959578,​ 14.354592561721802 50.096399008059755,​ 14.355171918869019 50.096392125534024,​ 14.355483055114746 50.09633018275811,​ 14.355762004852295 50.09634394782634,​ 14.358251094818113 50.096791310391346,​ 14.358723163604736 50.096873899946615,​ 14.359141588211058 50.09697713669046,​ 14.359956979751587 50.09699778401253,​ 14.36085820198059 50.09715607985288,​ 14.362660646438599 50.09761031718664,​ 14.363701343536377 50.09788561044452,​ 14.363905191421507 50.09789937506589,​ 14.364173412322996 50.09786496350506,​ 14.364463090896606 50.09773419934845)",​http://​www.opengis.net/​def/​crs/​EPSG/​0/​4258 
-442682,​Akátová,​554782,​Praha,​3100,​Hlavní město Praha,"​LINESTRING(14.41953420639038 50.077619800339754,​ 14.41979169845581 50.077647341221535,​ 14.421336650848389 50.07749586617591,​ 14.42479133605957 50.077330620125764,​ 14.429275989532469 50.07717914407949,​ 14.431657791137694 50.07711029117297)",​http://​www.opengis.net/​def/​crs/​EPSG/​0/​4258 
-</​code>​ 
  
     * [[http://​www.opengeospatial.org/​standards/​gml|Geography Markup Language]] (OGC GML) - jedná se formát XML pro prostorová data. Geometrie je zapisována za použití GML. Jedná se o komplexní formát, který je schopen zápisu v podstatě libovolného typu geometrických objektů a atributových hodnot. Formát GML ve verzi 3.2.1 je používán pro datové sady publikované podle směrnice [[https://​inspire.ec.europa.eu/​|INSPIRE]]. K zápisu jsou používány dvojice tagů, jazyk XML je rozšířen o abstraktní typ AbstractFeatureType,​ který musí obsahovat geometrický objekt. Pro komplexní poskytování dat ve formátu GML je vhodné vytvořit schéma dokumentu v XML Schema Definition (XSD), které zajišťuje validitu dat. Data pro adresní místa publikovaná v rámci směrnice INSPIRE pro Českou republiku vypadají takto:     * [[http://​www.opengeospatial.org/​standards/​gml|Geography Markup Language]] (OGC GML) - jedná se formát XML pro prostorová data. Geometrie je zapisována za použití GML. Jedná se o komplexní formát, který je schopen zápisu v podstatě libovolného typu geometrických objektů a atributových hodnot. Formát GML ve verzi 3.2.1 je používán pro datové sady publikované podle směrnice [[https://​inspire.ec.europa.eu/​|INSPIRE]]. K zápisu jsou používány dvojice tagů, jazyk XML je rozšířen o abstraktní typ AbstractFeatureType,​ který musí obsahovat geometrický objekt. Pro komplexní poskytování dat ve formátu GML je vhodné vytvořit schéma dokumentu v XML Schema Definition (XSD), které zajišťuje validitu dat. Data pro adresní místa publikovaná v rámci směrnice INSPIRE pro Českou republiku vypadají takto:
Řádek 162: Řádek 159:
 </​code>​ </​code>​
     * [[http://​www.opengeospatial.org/​standards/​geopackage|OGC GeoPackage]] - je nad souborovou databází [[https://​www.sqlite.org/​|SQLite]] postavený standardizovaný formát pro prostorová data. Lze do něj uložit stejnou ​ strukturu jako do CSV a složitou geometrickou strukturu jako samostatný atribut. Vzhledem ke své povaze umí GeoPackage spravovat mimo vektorových dat i rastrová data. Jedná se o souborovou databázi, takže zde není uveden příklad dat. Více informací je ve [[http://​www.opengeospatial.org/​standards/​geopackage|standardu]] a na [[http://​www.geopackage.org/​guidance/​getting-started.html|stránkách formátu]].     * [[http://​www.opengeospatial.org/​standards/​geopackage|OGC GeoPackage]] - je nad souborovou databází [[https://​www.sqlite.org/​|SQLite]] postavený standardizovaný formát pro prostorová data. Lze do něj uložit stejnou ​ strukturu jako do CSV a složitou geometrickou strukturu jako samostatný atribut. Vzhledem ke své povaze umí GeoPackage spravovat mimo vektorových dat i rastrová data. Jedná se o souborovou databázi, takže zde není uveden příklad dat. Více informací je ve [[http://​www.opengeospatial.org/​standards/​geopackage|standardu]] a na [[http://​www.geopackage.org/​guidance/​getting-started.html|stránkách formátu]].
 +    * [[https://​cs.wikipedia.org/​wiki/​CSV|Comma Separated Values]] (CSV, IETF RFC4180) - tabulkový způsob zápisu vhodný pro nepříliš komplexní data. Jednotlivé záznamy atributové tabulky jsou zapsány jako řádky textového souboru a hodnoty záznamů jako řetězce oddělené čárkou (znak UTF-8 s kódem U+002C). Zápis geometrického objektu zpravidla obsahuje čárky, proto je vhodné hodnoty uzavřít do uvozovek (znak UTF-8 s kódem U+0022). Pro zápis prostorové informace je vhodné použít WKT. Data ve formátu CSV by měla obsahovat informaci o použitém souřadnicovém referenčním systému buď formou EPSG kódu, nebo URI (viz //Poznámka k souřadnicovým systémům//​),​ buď v hlavičce souboru, nebo jako atribut. Data obsahující informace o ulicích s geometrií uliční čáry by mohly vypadat například takto:
 +<​code>​Kód,​Název ulice,Kód Obce,Název Obce,Kód Okresu,​Název Okresu,​WKT_Geometry,​CRS
 +442666,​Adamovská,​554782,​Praha,​3100,​Hlavní město Praha,"​LINESTRING(14.450325965881346 50.05789646795757,​ 14.450948238372803 50.05791713211645,​ 14.45121645927429 50.05803422884852,​ 14.451420307159424 50.058764354966634,​ 14.451624155044554 50.0591569653608,​ 14.451828002929688 50.059460030836206,​ 14.45177435874939 50.059522021265785)",​http://​www.opengis.net/​def/​crs/​EPSG/​0/​4258
 +442674,​Africká,​554782,​Praha,​3100,​Hlavní město Praha,"​LINESTRING(14.349464178085329 50.09616500163075,​ 14.349786043167112 50.096075528282334,​ 14.349968433380127 50.09575892893866,​ 14.350258111953734 50.09575892893866,​ 14.350826740264893 50.09566257220141,​ 14.352350234985352 50.09597228959578,​ 14.354592561721802 50.096399008059755,​ 14.355171918869019 50.096392125534024,​ 14.355483055114746 50.09633018275811,​ 14.355762004852295 50.09634394782634,​ 14.358251094818113 50.096791310391346,​ 14.358723163604736 50.096873899946615,​ 14.359141588211058 50.09697713669046,​ 14.359956979751587 50.09699778401253,​ 14.36085820198059 50.09715607985288,​ 14.362660646438599 50.09761031718664,​ 14.363701343536377 50.09788561044452,​ 14.363905191421507 50.09789937506589,​ 14.364173412322996 50.09786496350506,​ 14.364463090896606 50.09773419934845)",​http://​www.opengis.net/​def/​crs/​EPSG/​0/​4258
 +442682,​Akátová,​554782,​Praha,​3100,​Hlavní město Praha,"​LINESTRING(14.41953420639038 50.077619800339754,​ 14.41979169845581 50.077647341221535,​ 14.421336650848389 50.07749586617591,​ 14.42479133605957 50.077330620125764,​ 14.429275989532469 50.07717914407949,​ 14.431657791137694 50.07711029117297)",​http://​www.opengis.net/​def/​crs/​EPSG/​0/​4258
 +</​code>​
     * [[https://​www.esri.com/​library/​whitepapers/​pdfs/​shapefile.pdf|ESRI Shapefile]] - je poměrně zastaralý, přesto stále hojně používaný formát pro správu prostorových dat vyvinutý společností ESRI, která uvolnila [[https://​www.esri.com/​library/​whitepapers/​pdfs/​shapefile.pdf|technickou dokumentaci]] formátu. Jedná se o otevřený formát, který uchovává informace ve více souborech. Vlastnosti jednotlivých prvků dodržují strukturu pro datovou sadu. Organizace spravující data prostřednictvím software od společnosti ESRI by s publikací dat v tomto formátu neměly mít problémy.     * [[https://​www.esri.com/​library/​whitepapers/​pdfs/​shapefile.pdf|ESRI Shapefile]] - je poměrně zastaralý, přesto stále hojně používaný formát pro správu prostorových dat vyvinutý společností ESRI, která uvolnila [[https://​www.esri.com/​library/​whitepapers/​pdfs/​shapefile.pdf|technickou dokumentaci]] formátu. Jedná se o otevřený formát, který uchovává informace ve více souborech. Vlastnosti jednotlivých prvků dodržují strukturu pro datovou sadu. Organizace spravující data prostřednictvím software od společnosti ESRI by s publikací dat v tomto formátu neměly mít problémy.
  
Řádek 190: Řádek 193:
 === Metadata === === Metadata ===
  
-Kromě smotných dat je vhodné poskytovat i metadata -- data o datech. Pro soulad se stupněm otevřenosti 3 to ale není nezbytné. Pro popis prostorových dat se běžně používá ​meatadový ​standard dle normy [[https://​www.iso.org/​standard/​26020.html|ISO 19115]]. Mezi základní poskytované informace patří poskytovatel dat a kontakt na něj, informace o aktuálnosti a úplnosti dat, o jejich územním rozsahu, o způsobech publikace a licenci nebo o kvalitě těchto dat. +Kromě smotných dat je vhodné poskytovat i metadata -- data o datech. Pro soulad se stupněm otevřenosti 3 to ale není nezbytné. Pro popis prostorových dat se běžně používá ​metadový ​standard dle normy [[https://​www.iso.org/​standard/​26020.html|ISO 19115]]. Mezi základní poskytované informace patří poskytovatel dat a kontakt na něj, informace o aktuálnosti a úplnosti dat, o jejich územním rozsahu, o způsobech publikace a licenci nebo o kvalitě těchto dat. 
  
 V případě poskytování dat pomocí OGC standardizovaných služeb je vhodné poskytovat i metadata o těchto službách (např. podle standardu [[https://​www.iso.org/​standard/​59221.html|ISO 19119]]). Pro poskytování a vyhledávání metadat existuje služba [[http://​www.opengeospatial.org/​standards/​csw|OGC CSW]], která spravuje poskytování metadatových záznamů a umožňuje vyhledávání datových sad a služeb na základě jejich metadat. ​ V případě poskytování dat pomocí OGC standardizovaných služeb je vhodné poskytovat i metadata o těchto službách (např. podle standardu [[https://​www.iso.org/​standard/​59221.html|ISO 19119]]). Pro poskytování a vyhledávání metadat existuje služba [[http://​www.opengeospatial.org/​standards/​csw|OGC CSW]], která spravuje poskytování metadatových záznamů a umožňuje vyhledávání datových sad a služeb na základě jejich metadat. ​
 +
 +V případě tvorby metadat dle norem ISO 19115 a 19119 je vhodné použít český metadatový profil, který mimo jiné definuje položku o otevřenosti dat.
  
 === INSPIRE === === INSPIRE ===