draft:technicke-standardy-pro-datove-sady-na-stupni-3

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revize Předchozí verze
Následující verze
Předchozí verze
Následující verzeObě strany příští revize
draft:technicke-standardy-pro-datove-sady-na-stupni-3 [2018/06/24 11:58] – publikace a metadata michal.meddraft:technicke-standardy-pro-datove-sady-na-stupni-3 [2018/06/26 13:35] michal.med
Řádek 1: Řádek 1:
-=============Draft================== 
-=== Poznámky, které je třeba zapracovat === 
-  * Rastrová data -- zmínit v předchozí subsekci (obrazová data). 
-  * Formáty vektorových dat 
-  * Formáty rastrových dat 
-  * Metadata 
-  * Publikace (WFS, ATOM, vyvěsit na web) 
-  * INSPIRE 
-  * souřadnice, proprietární služby 
- 
 ==== Standardy pro prostorové datové sady ==== ==== Standardy pro prostorové datové sady ====
  
Řádek 17: Řádek 7:
 === Geometrické objekty === === Geometrické objekty ===
  
-vyjádření geometrického objektu je vhodné používat buď WKTnebo GML interpretaci.+Obecně je vhodné k vyjádření geometrického objektu používat interpretaci geometrických objektů takjak je definována v použitém formátu. Nejrozšířenější formáty pro zápis geometrických objektů jsou WKT a GML.
  
 **Well-Known Text (WKT)** -- formát byl vytvořen OGC a je specifikován ve standardech [[http://www.opengeospatial.org/standards/sfa|Simple Feature Access]] a ISO 19125. Je vhodný především k zápisu 2D geometrií, jako je point, multipoint, line, polyline, polygon a pod. Přestože je ve WKT možné definovat souřadnicové systémy a používat je pro reprezentované objekty, nejčastěji je WKT používán pro reprezentaci souřadnic v souřadnicovém systému WGS 84. **Well-Known Text (WKT)** -- formát byl vytvořen OGC a je specifikován ve standardech [[http://www.opengeospatial.org/standards/sfa|Simple Feature Access]] a ISO 19125. Je vhodný především k zápisu 2D geometrií, jako je point, multipoint, line, polyline, polygon a pod. Přestože je ve WKT možné definovat souřadnicové systémy a používat je pro reprezentované objekty, nejčastěji je WKT používán pro reprezentaci souřadnic v souřadnicovém systému WGS 84.
  
-**Geography Mark-up Language (GML)** -- formát je rozšířením značkovacího jazyka XML za účelem reprezentace geometrických objektů. Je definován ve standardu OGC [[http://www.opengeospatial.org/standards/gml|Geography Markup Language]] a proti WKT je velice robustní. Umožňuje zápis souřadnic v mnoha souřadnicových systémech (pro ČR je nejdůležitější podpora souřadnicového referenčního systému S-JTSK) a umožňuje reprezentaci všech forem prostorových informací, včetně pokryvu nebo senzorových dat. Větší robustnost je vykoupena větší složitostí zápisu.+**Geography Mark-up Language (GML)** -- formát je rozšířením značkovacího jazyka XML za účelem reprezentace geometrických objektů. Je definován ve standardu OGC [[http://www.opengeospatial.org/standards/gml|Geography Markup Language]] a proti WKT je velice robustní. Umožňuje zápis souřadnic v mnoha souřadnicových systémech (pro ČR je nejdůležitější podpora souřadnicového referenčního systému S-JTSK) a reprezentaci všech forem prostorových informací, včetně pokryvu nebo senzorových dat. Větší robustnost je vykoupena větší složitostí zápisu.
  
 Základními geometrickými objekty jsou: Základními geometrickými objekty jsou:
Řádek 76: Řádek 66:
    
 Datové sady prostorových dat by měly být publikovány ve vhodném otevřeném formátu, který musí umožnit strojovou čitelnost. Následuje seznam doporučených otevřených formátů: Datové sady prostorových dat by měly být publikovány ve vhodném otevřeném formátu, který musí umožnit strojovou čitelnost. Následuje seznam doporučených otevřených formátů:
- 
-    * [[https://cs.wikipedia.org/wiki/CSV|Comma Separated Values]] (CSV, IETF RFC4180) - tabulkový způsob zápisu vhodný pro nepříliš komplexní data. Jednotlivé záznamy atributové tabulky jsou zapsány jako řádky textového souboru a hodnoty záznamů jako řetězce oddělené čárkou (znak UTF-8 s kódem U+002C). Zápis geometrického objektu zpravidla obsahuje čárky, proto je vhodné hodnoty uzavřít do uvozovek (znak UTF-8 s kódem U+0022). Pro zápis prostorové informace je vhodné použít WKT. Data ve formátu CSV by měla obsahovat informaci o použitém souřadnicovém referenčním systému buď formou EPSG kódu, nebo URI (viz //Poznámka k souřadnicovým systémům//), buď v hlavičce souboru, nebo jako atribut. Data obsahující informace o ulicích s geometrií uliční čáry by mohly vypadat například takto: 
-<code>Kód,Název ulice,Kód Obce,Název Obce,Kód Okresu,Název Okresu,WKT_Geometry,CRS 
-442666,Adamovská,554782,Praha,3100,Hlavní město Praha,"LINESTRING(14.450325965881346 50.05789646795757, 14.450948238372803 50.05791713211645, 14.45121645927429 50.05803422884852, 14.451420307159424 50.058764354966634, 14.451624155044554 50.0591569653608, 14.451828002929688 50.059460030836206, 14.45177435874939 50.059522021265785)",http://www.opengis.net/def/crs/EPSG/0/4258 
-442674,Africká,554782,Praha,3100,Hlavní město Praha,"LINESTRING(14.349464178085329 50.09616500163075, 14.349786043167112 50.096075528282334, 14.349968433380127 50.09575892893866, 14.350258111953734 50.09575892893866, 14.350826740264893 50.09566257220141, 14.352350234985352 50.09597228959578, 14.354592561721802 50.096399008059755, 14.355171918869019 50.096392125534024, 14.355483055114746 50.09633018275811, 14.355762004852295 50.09634394782634, 14.358251094818113 50.096791310391346, 14.358723163604736 50.096873899946615, 14.359141588211058 50.09697713669046, 14.359956979751587 50.09699778401253, 14.36085820198059 50.09715607985288, 14.362660646438599 50.09761031718664, 14.363701343536377 50.09788561044452, 14.363905191421507 50.09789937506589, 14.364173412322996 50.09786496350506, 14.364463090896606 50.09773419934845)",http://www.opengis.net/def/crs/EPSG/0/4258 
-442682,Akátová,554782,Praha,3100,Hlavní město Praha,"LINESTRING(14.41953420639038 50.077619800339754, 14.41979169845581 50.077647341221535, 14.421336650848389 50.07749586617591, 14.42479133605957 50.077330620125764, 14.429275989532469 50.07717914407949, 14.431657791137694 50.07711029117297)",http://www.opengis.net/def/crs/EPSG/0/4258 
-</code> 
  
     * [[http://www.opengeospatial.org/standards/gml|Geography Markup Language]] (OGC GML) - jedná se formát XML pro prostorová data. Geometrie je zapisována za použití GML. Jedná se o komplexní formát, který je schopen zápisu v podstatě libovolného typu geometrických objektů a atributových hodnot. Formát GML ve verzi 3.2.1 je používán pro datové sady publikované podle směrnice [[https://inspire.ec.europa.eu/|INSPIRE]]. K zápisu jsou používány dvojice tagů, jazyk XML je rozšířen o abstraktní typ AbstractFeatureType, který musí obsahovat geometrický objekt. Pro komplexní poskytování dat ve formátu GML je vhodné vytvořit schéma dokumentu v XML Schema Definition (XSD), které zajišťuje validitu dat. Data pro adresní místa publikovaná v rámci směrnice INSPIRE pro Českou republiku vypadají takto:     * [[http://www.opengeospatial.org/standards/gml|Geography Markup Language]] (OGC GML) - jedná se formát XML pro prostorová data. Geometrie je zapisována za použití GML. Jedná se o komplexní formát, který je schopen zápisu v podstatě libovolného typu geometrických objektů a atributových hodnot. Formát GML ve verzi 3.2.1 je používán pro datové sady publikované podle směrnice [[https://inspire.ec.europa.eu/|INSPIRE]]. K zápisu jsou používány dvojice tagů, jazyk XML je rozšířen o abstraktní typ AbstractFeatureType, který musí obsahovat geometrický objekt. Pro komplexní poskytování dat ve formátu GML je vhodné vytvořit schéma dokumentu v XML Schema Definition (XSD), které zajišťuje validitu dat. Data pro adresní místa publikovaná v rámci směrnice INSPIRE pro Českou republiku vypadají takto:
Řádek 171: Řádek 154:
 </code> </code>
     * [[http://www.opengeospatial.org/standards/geopackage|OGC GeoPackage]] - je nad souborovou databází [[https://www.sqlite.org/|SQLite]] postavený standardizovaný formát pro prostorová data. Lze do něj uložit stejnou  strukturu jako do CSV a složitou geometrickou strukturu jako samostatný atribut. Vzhledem ke své povaze umí GeoPackage spravovat mimo vektorových dat i rastrová data. Jedná se o souborovou databázi, takže zde není uveden příklad dat. Více informací je ve [[http://www.opengeospatial.org/standards/geopackage|standardu]] a na [[http://www.geopackage.org/guidance/getting-started.html|stránkách formátu]].     * [[http://www.opengeospatial.org/standards/geopackage|OGC GeoPackage]] - je nad souborovou databází [[https://www.sqlite.org/|SQLite]] postavený standardizovaný formát pro prostorová data. Lze do něj uložit stejnou  strukturu jako do CSV a složitou geometrickou strukturu jako samostatný atribut. Vzhledem ke své povaze umí GeoPackage spravovat mimo vektorových dat i rastrová data. Jedná se o souborovou databázi, takže zde není uveden příklad dat. Více informací je ve [[http://www.opengeospatial.org/standards/geopackage|standardu]] a na [[http://www.geopackage.org/guidance/getting-started.html|stránkách formátu]].
 +    * [[https://cs.wikipedia.org/wiki/CSV|Comma Separated Values]] (CSV, IETF RFC4180) - tabulkový způsob zápisu vhodný pro nepříliš komplexní data. Jednotlivé záznamy atributové tabulky jsou zapsány jako řádky textového souboru a hodnoty záznamů jako řetězce oddělené čárkou (znak UTF-8 s kódem U+002C). Zápis geometrického objektu zpravidla obsahuje čárky, proto je vhodné hodnoty uzavřít do uvozovek (znak UTF-8 s kódem U+0022). Pro zápis prostorové informace je vhodné použít WKT. Data ve formátu CSV by měla obsahovat informaci o použitém souřadnicovém referenčním systému buď formou EPSG kódu, nebo URI (viz //Poznámka k souřadnicovým systémům//), buď v hlavičce souboru, nebo jako atribut. Data obsahující informace o ulicích s geometrií uliční čáry by mohly vypadat například takto:
 +<code>Kód,Název ulice,Kód Obce,Název Obce,Kód Okresu,Název Okresu,WKT_Geometry,CRS
 +442666,Adamovská,554782,Praha,3100,Hlavní město Praha,"LINESTRING(14.450325965881346 50.05789646795757, 14.450948238372803 50.05791713211645, 14.45121645927429 50.05803422884852, 14.451420307159424 50.058764354966634, 14.451624155044554 50.0591569653608, 14.451828002929688 50.059460030836206, 14.45177435874939 50.059522021265785)",http://www.opengis.net/def/crs/EPSG/0/4258
 +442674,Africká,554782,Praha,3100,Hlavní město Praha,"LINESTRING(14.349464178085329 50.09616500163075, 14.349786043167112 50.096075528282334, 14.349968433380127 50.09575892893866, 14.350258111953734 50.09575892893866, 14.350826740264893 50.09566257220141, 14.352350234985352 50.09597228959578, 14.354592561721802 50.096399008059755, 14.355171918869019 50.096392125534024, 14.355483055114746 50.09633018275811, 14.355762004852295 50.09634394782634, 14.358251094818113 50.096791310391346, 14.358723163604736 50.096873899946615, 14.359141588211058 50.09697713669046, 14.359956979751587 50.09699778401253, 14.36085820198059 50.09715607985288, 14.362660646438599 50.09761031718664, 14.363701343536377 50.09788561044452, 14.363905191421507 50.09789937506589, 14.364173412322996 50.09786496350506, 14.364463090896606 50.09773419934845)",http://www.opengis.net/def/crs/EPSG/0/4258
 +442682,Akátová,554782,Praha,3100,Hlavní město Praha,"LINESTRING(14.41953420639038 50.077619800339754, 14.41979169845581 50.077647341221535, 14.421336650848389 50.07749586617591, 14.42479133605957 50.077330620125764, 14.429275989532469 50.07717914407949, 14.431657791137694 50.07711029117297)",http://www.opengis.net/def/crs/EPSG/0/4258
 +</code>
     * [[https://www.esri.com/library/whitepapers/pdfs/shapefile.pdf|ESRI Shapefile]] - je poměrně zastaralý, přesto stále hojně používaný formát pro správu prostorových dat vyvinutý společností ESRI, která uvolnila [[https://www.esri.com/library/whitepapers/pdfs/shapefile.pdf|technickou dokumentaci]] formátu. Jedná se o otevřený formát, který uchovává informace ve více souborech. Vlastnosti jednotlivých prvků dodržují strukturu pro datovou sadu. Organizace spravující data prostřednictvím software od společnosti ESRI by s publikací dat v tomto formátu neměly mít problémy.     * [[https://www.esri.com/library/whitepapers/pdfs/shapefile.pdf|ESRI Shapefile]] - je poměrně zastaralý, přesto stále hojně používaný formát pro správu prostorových dat vyvinutý společností ESRI, která uvolnila [[https://www.esri.com/library/whitepapers/pdfs/shapefile.pdf|technickou dokumentaci]] formátu. Jedná se o otevřený formát, který uchovává informace ve více souborech. Vlastnosti jednotlivých prvků dodržují strukturu pro datovou sadu. Organizace spravující data prostřednictvím software od společnosti ESRI by s publikací dat v tomto formátu neměly mít problémy.
  
Řádek 195: Řádek 184:
 Kromě výše uvedených služeb standatrdizovaných OGC jsou ještě hojně používanéí služby [[http://www.opengeospatial.org/standards/wms|WMS]] (Web Map Service) a [[http://www.opengeospatial.org/standards/wmts|WMTS]] (Web Map Tile Service), nejedná se však o služby poskytující otevřená data -- služby poskytují pouze otisk data ve formě obrázku. Nicméně jsou vhodné k prohlížení dat nebo jako podkladové vrstvy ve webových prohlížečkách. Kromě výše uvedených služeb standatrdizovaných OGC jsou ještě hojně používanéí služby [[http://www.opengeospatial.org/standards/wms|WMS]] (Web Map Service) a [[http://www.opengeospatial.org/standards/wmts|WMTS]] (Web Map Tile Service), nejedná se však o služby poskytující otevřená data -- služby poskytují pouze otisk data ve formě obrázku. Nicméně jsou vhodné k prohlížení dat nebo jako podkladové vrstvy ve webových prohlížečkách.
  
-Pokud jsou data organizace poskytována nebo zpracovávána externím subjektem -- napřílad firmou zpracovávající územní plán -- měli by zadavatelé trvat na odevzdání práce v některém z otevřených formátů prostorových dat. Podstatné je vyhnout se uzavřeným formátům (mezi nejčastěji používané uzavřené formáty patří DWG, DGN, ESRI GeoDatabase a další).+Pokud jsou data organizace poskytována nebo zpracovávána externím subjektem -- napřílad firmou zpracovávající územní plán -- měli by zadavatelé trvat na odevzdání práce v některém z otevřených formátů prostorových dat. Podstatné je vyhnout se uzavřeným formátům (mezi nejčastěji používané uzavřené formáty patří DWG, DGN, ESRI GeoDatabase a další). Stejně tak je vhodné vyhnout se proprietárním službám pro publikaci, které používají některé GIS softwary. Data publikovaná prostřednictvím těchto služeb nelze považovat za dostatečně otevřená. Nebývají podporována existujícími softwary třetích stran a licenční podmínky jejich využití nejsou často transparentní. Jedná se například o tzv. REST API v softwarech firmy ESRI
  
 === Metadata === === Metadata ===
  
-Kromě smotných dat je vhodné poskytovat i metadata -- data o datech. Pro soulad se stupněm otevřenosti 3 to ale není nezbytné. Pro popis prostorových dat se běžně používá meatadový standard dle normy [[https://www.iso.org/standard/26020.html|ISO 19115]]. Mezi základní poskytované informace patří poskytovatel dat a kontakt na něj, informace o aktuálnosti a úplnosti dat, o jejich územním rozsahu, o způsobech publikace a licenci nebo o kvalitě těchto dat. +Kromě smotných dat je vhodné poskytovat i metadata -- data o datech. Pro soulad se stupněm otevřenosti 3 to ale není nezbytné. Pro popis prostorových dat se běžně používá metadový standard dle normy [[https://www.iso.org/standard/26020.html|ISO 19115]]. Mezi základní poskytované informace patří poskytovatel dat a kontakt na něj, informace o aktuálnosti a úplnosti dat, o jejich územním rozsahu, o způsobech publikace a licenci nebo o kvalitě těchto dat. 
  
 V případě poskytování dat pomocí OGC standardizovaných služeb je vhodné poskytovat i metadata o těchto službách (např. podle standardu [[https://www.iso.org/standard/59221.html|ISO 19119]]). Pro poskytování a vyhledávání metadat existuje služba [[http://www.opengeospatial.org/standards/csw|OGC CSW]], která spravuje poskytování metadatových záznamů a umožňuje vyhledávání datových sad a služeb na základě jejich metadat.  V případě poskytování dat pomocí OGC standardizovaných služeb je vhodné poskytovat i metadata o těchto službách (např. podle standardu [[https://www.iso.org/standard/59221.html|ISO 19119]]). Pro poskytování a vyhledávání metadat existuje služba [[http://www.opengeospatial.org/standards/csw|OGC CSW]], která spravuje poskytování metadatových záznamů a umožňuje vyhledávání datových sad a služeb na základě jejich metadat. 
  
-===tady jsem skončil=== +V případě tvorby metadat dle norem ISO 19115 a 19119 je vhodné použít český metadatový profilkterý mimo jiné definuje položku o otevřenosti dat.
- +
-** Poznámka k proprietárním službám ** +
- +
-Některé nástroje GIS obsahují proprietární služby pro publikaci dat. Data publikovaná prostřednictvím těchto služeb nelze považovat za dostatečně otevřená. Nebývají podporována existujícími softwary třetích stran, licenční podmínky jejich využití nejsou často transparentní. Jedná se například o tzv. REST API v softwarech firmy ESRI.  +
- +
-** Poznámka k souřadnicovým systémům ** +
- +
-**EPSG** - je uznávaný registr mimo jiné pro popis souřadnicových systémů, podporovaný všemi programy pro práci s prostorovými daty (GIS). Relevantní hodnoty pro Českou republiku jsou +
- +
-  * 5514 - Systém jednotné trigonometrické sítě katastrální (S-JTSK) - používaný např. v katastru nemovitostí. Pro tento systém je mimo jiné v GIS typické, že souřadnice nabývají negativních hodnot (jsou uvozeny znaménkem minus). +
-  * 4326 - World Geodetic System 1984 (WGS84), někdy zvaný též “souřadnice GPS”. Souřadnice bývají uvedeny ve stupních s desetinným číslem. Některé publikační formáty (např. GPX nebo KML) počítají přímo s tímže data jsou uložena v tomto souřadnicovém systému. +
-  * 3857 - tzv. Web (nebo též Google) Mercator - je systém používaný na většině globálních webových aplikací. Jeho nevýhodou je mimo jiné zkreslení významné velikosti ploch směrem k pólům. +
- +
-Další lze dohledat např. na stránce http://epsg.io  +
- +
-** Poznámka k zápisu geometrie ** +
- +
-**WKT** - Well Known Text - je standardní formát zápisu vektorové geometrie. Popis je mimo jiné k nalezení ve specifikaci OGC [[http://www.opengeospatial.org/standards/sfa|Simple Features]].+
  
 +=== INSPIRE ===
  
-^ Typ ^ Příklad ^ +V roce 2007 vešla v platnost směrnice [[https://inspire.ec.europa.eu/|INSPIRE]] (Infrastructure for Spatial Information in Europe), která si klade za cíl standardizovat publikaci prostrových dat v Evropě. Data rozděluje do 34 témat na základě obsahu a definuje strukturuv jaké by měly být data poskytovány. Kromě toho vyžaduje užívání standardůkteré v tomto textu již byly několikrát zmíněnyjako je využití formátu GMLpublikace dat prostřednictvím webových služeb OGC WFSOGC WCS nebo pomocí ATOM, opatření data služeb metadata podle standardů ISO 19115 a 19119 a jejich správě za pomoci služby OGC CSW. V případě publikace dat orgánem státní správy je vhodné pokusit se publikovat data v souladu se směrnicí INSPIRE a to i v případě, že se nejedná o povinného poskytovatele ve smyslu implementace této směrnice.
-| Bod POINT (30 10+
-| Linie | LINESTRING (30 1010 3040 40) | +
-| Polygon | POLYGON ( (30 1040 4020 4010 2030 10) ) |+
  
-Pomocí WKT lze samozřejmě uložit i komplikovanější datové typy, jako jsou MULTIPOINTS či CompoundCurve a další.+=== Souřadnicové referenční systémy ===
  
-Pokud uvažujete o použití WKT pro popis atributu geometrie u objektů, zvažte publikaci otevřené datové sady v některém k tomu určeném otevřeném formátu (ESRI Shapefile, KML, OGC GeoPackage nebo GeoJSON).+Pro definici souřadnicových systémů je používán registr EPSG (European Petroleum Survey Group), podporovaný všemi programy pro práci s prostorovými daty (GIS). Registr obsahuje celou řadu souřadnicových referenčních systémů, které opatřuje kódem. V České republice jsou nejčastěji využívány tyto souřadnicové referenční systémy:
  
-Problematikou otevírání prostorových dat se podrobně zabývá publikace [[http://opengeolabs.cz/otevrena-geodata/|Otevírání prostorových dat - případová studie]].+  * Systém jednotné trigonometrické sítě katastrální (S-JTSK) -- používaný napřv katastru nemovitostí. Pro využití v GIS je využíváno EPSG kódu 5514, který otáčí osy systému a souřadnice nabývají negativních hodnot (jsou uvozeny znaménkem minus). 
 +  * World Geodetic System 1984 (WGS84) -- někdy zvaný též “souřadnice GPS”. Souřadnice bývají uvedeny ve stupních s desetinným číslem. Některé publikační formáty (např. GPX nebo KML) počítají ímo s tím, že data jsou uložena v tomto souřadnicovém systému. V registru EPSG je souřadnicový systém označen kódem 4326. 
 +  * Web (nebo též Google) Mercator -- je systém používaný na většině globálních webových aplikací. Jeho nevýhodou je mimo jiné zkreslení významné velikosti ploch směrem k pólům. Je označen kódem 3857. 
 +  * European Terrestrial Reference System -- je systém zpřesňující WGS pro území Evropy. Zápis je stejný jako u WGS, souřadnice se liší v rámci milimetrů až centimetrů. Je označen kódem 4258.
  
 +Další souřadnicové referenční systémy lze dohledat např. [[http://epsg.io|zde]].