draft:technicke-standardy-pro-datove-sady-na-stupni-3

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revize Předchozí verze
Následující verze
Předchozí verze
Následující verzeObě strany příští revize
draft:technicke-standardy-pro-datove-sady-na-stupni-3 [2018/06/24 12:18] – [Draft] michal.meddraft:technicke-standardy-pro-datove-sady-na-stupni-3 [2018/06/25 14:01] michal.med
Řádek 8: Řádek 8:
 === Geometrické objekty === === Geometrické objekty ===
  
-vyjádření geometrického objektu je vhodné používat buď WKTnebo GML interpretaci.+Obecně je vhodné k vyjádření geometrického objektu používat interpretaci geometrických objektů takjak je definována v použitém formátu. Nejrozšířenější formáty pro zápis geometrických objektů jsou WKT a GML.
  
 **Well-Known Text (WKT)** -- formát byl vytvořen OGC a je specifikován ve standardech [[http://www.opengeospatial.org/standards/sfa|Simple Feature Access]] a ISO 19125. Je vhodný především k zápisu 2D geometrií, jako je point, multipoint, line, polyline, polygon a pod. Přestože je ve WKT možné definovat souřadnicové systémy a používat je pro reprezentované objekty, nejčastěji je WKT používán pro reprezentaci souřadnic v souřadnicovém systému WGS 84. **Well-Known Text (WKT)** -- formát byl vytvořen OGC a je specifikován ve standardech [[http://www.opengeospatial.org/standards/sfa|Simple Feature Access]] a ISO 19125. Je vhodný především k zápisu 2D geometrií, jako je point, multipoint, line, polyline, polygon a pod. Přestože je ve WKT možné definovat souřadnicové systémy a používat je pro reprezentované objekty, nejčastěji je WKT používán pro reprezentaci souřadnic v souřadnicovém systému WGS 84.
Řádek 67: Řádek 67:
    
 Datové sady prostorových dat by měly být publikovány ve vhodném otevřeném formátu, který musí umožnit strojovou čitelnost. Následuje seznam doporučených otevřených formátů: Datové sady prostorových dat by měly být publikovány ve vhodném otevřeném formátu, který musí umožnit strojovou čitelnost. Následuje seznam doporučených otevřených formátů:
- 
-    * [[https://cs.wikipedia.org/wiki/CSV|Comma Separated Values]] (CSV, IETF RFC4180) - tabulkový způsob zápisu vhodný pro nepříliš komplexní data. Jednotlivé záznamy atributové tabulky jsou zapsány jako řádky textového souboru a hodnoty záznamů jako řetězce oddělené čárkou (znak UTF-8 s kódem U+002C). Zápis geometrického objektu zpravidla obsahuje čárky, proto je vhodné hodnoty uzavřít do uvozovek (znak UTF-8 s kódem U+0022). Pro zápis prostorové informace je vhodné použít WKT. Data ve formátu CSV by měla obsahovat informaci o použitém souřadnicovém referenčním systému buď formou EPSG kódu, nebo URI (viz //Poznámka k souřadnicovým systémům//), buď v hlavičce souboru, nebo jako atribut. Data obsahující informace o ulicích s geometrií uliční čáry by mohly vypadat například takto: 
-<code>Kód,Název ulice,Kód Obce,Název Obce,Kód Okresu,Název Okresu,WKT_Geometry,CRS 
-442666,Adamovská,554782,Praha,3100,Hlavní město Praha,"LINESTRING(14.450325965881346 50.05789646795757, 14.450948238372803 50.05791713211645, 14.45121645927429 50.05803422884852, 14.451420307159424 50.058764354966634, 14.451624155044554 50.0591569653608, 14.451828002929688 50.059460030836206, 14.45177435874939 50.059522021265785)",http://www.opengis.net/def/crs/EPSG/0/4258 
-442674,Africká,554782,Praha,3100,Hlavní město Praha,"LINESTRING(14.349464178085329 50.09616500163075, 14.349786043167112 50.096075528282334, 14.349968433380127 50.09575892893866, 14.350258111953734 50.09575892893866, 14.350826740264893 50.09566257220141, 14.352350234985352 50.09597228959578, 14.354592561721802 50.096399008059755, 14.355171918869019 50.096392125534024, 14.355483055114746 50.09633018275811, 14.355762004852295 50.09634394782634, 14.358251094818113 50.096791310391346, 14.358723163604736 50.096873899946615, 14.359141588211058 50.09697713669046, 14.359956979751587 50.09699778401253, 14.36085820198059 50.09715607985288, 14.362660646438599 50.09761031718664, 14.363701343536377 50.09788561044452, 14.363905191421507 50.09789937506589, 14.364173412322996 50.09786496350506, 14.364463090896606 50.09773419934845)",http://www.opengis.net/def/crs/EPSG/0/4258 
-442682,Akátová,554782,Praha,3100,Hlavní město Praha,"LINESTRING(14.41953420639038 50.077619800339754, 14.41979169845581 50.077647341221535, 14.421336650848389 50.07749586617591, 14.42479133605957 50.077330620125764, 14.429275989532469 50.07717914407949, 14.431657791137694 50.07711029117297)",http://www.opengis.net/def/crs/EPSG/0/4258 
-</code> 
  
     * [[http://www.opengeospatial.org/standards/gml|Geography Markup Language]] (OGC GML) - jedná se formát XML pro prostorová data. Geometrie je zapisována za použití GML. Jedná se o komplexní formát, který je schopen zápisu v podstatě libovolného typu geometrických objektů a atributových hodnot. Formát GML ve verzi 3.2.1 je používán pro datové sady publikované podle směrnice [[https://inspire.ec.europa.eu/|INSPIRE]]. K zápisu jsou používány dvojice tagů, jazyk XML je rozšířen o abstraktní typ AbstractFeatureType, který musí obsahovat geometrický objekt. Pro komplexní poskytování dat ve formátu GML je vhodné vytvořit schéma dokumentu v XML Schema Definition (XSD), které zajišťuje validitu dat. Data pro adresní místa publikovaná v rámci směrnice INSPIRE pro Českou republiku vypadají takto:     * [[http://www.opengeospatial.org/standards/gml|Geography Markup Language]] (OGC GML) - jedná se formát XML pro prostorová data. Geometrie je zapisována za použití GML. Jedná se o komplexní formát, který je schopen zápisu v podstatě libovolného typu geometrických objektů a atributových hodnot. Formát GML ve verzi 3.2.1 je používán pro datové sady publikované podle směrnice [[https://inspire.ec.europa.eu/|INSPIRE]]. K zápisu jsou používány dvojice tagů, jazyk XML je rozšířen o abstraktní typ AbstractFeatureType, který musí obsahovat geometrický objekt. Pro komplexní poskytování dat ve formátu GML je vhodné vytvořit schéma dokumentu v XML Schema Definition (XSD), které zajišťuje validitu dat. Data pro adresní místa publikovaná v rámci směrnice INSPIRE pro Českou republiku vypadají takto:
Řádek 162: Řádek 155:
 </code> </code>
     * [[http://www.opengeospatial.org/standards/geopackage|OGC GeoPackage]] - je nad souborovou databází [[https://www.sqlite.org/|SQLite]] postavený standardizovaný formát pro prostorová data. Lze do něj uložit stejnou  strukturu jako do CSV a složitou geometrickou strukturu jako samostatný atribut. Vzhledem ke své povaze umí GeoPackage spravovat mimo vektorových dat i rastrová data. Jedná se o souborovou databázi, takže zde není uveden příklad dat. Více informací je ve [[http://www.opengeospatial.org/standards/geopackage|standardu]] a na [[http://www.geopackage.org/guidance/getting-started.html|stránkách formátu]].     * [[http://www.opengeospatial.org/standards/geopackage|OGC GeoPackage]] - je nad souborovou databází [[https://www.sqlite.org/|SQLite]] postavený standardizovaný formát pro prostorová data. Lze do něj uložit stejnou  strukturu jako do CSV a složitou geometrickou strukturu jako samostatný atribut. Vzhledem ke své povaze umí GeoPackage spravovat mimo vektorových dat i rastrová data. Jedná se o souborovou databázi, takže zde není uveden příklad dat. Více informací je ve [[http://www.opengeospatial.org/standards/geopackage|standardu]] a na [[http://www.geopackage.org/guidance/getting-started.html|stránkách formátu]].
 +    * [[https://cs.wikipedia.org/wiki/CSV|Comma Separated Values]] (CSV, IETF RFC4180) - tabulkový způsob zápisu vhodný pro nepříliš komplexní data. Jednotlivé záznamy atributové tabulky jsou zapsány jako řádky textového souboru a hodnoty záznamů jako řetězce oddělené čárkou (znak UTF-8 s kódem U+002C). Zápis geometrického objektu zpravidla obsahuje čárky, proto je vhodné hodnoty uzavřít do uvozovek (znak UTF-8 s kódem U+0022). Pro zápis prostorové informace je vhodné použít WKT. Data ve formátu CSV by měla obsahovat informaci o použitém souřadnicovém referenčním systému buď formou EPSG kódu, nebo URI (viz //Poznámka k souřadnicovým systémům//), buď v hlavičce souboru, nebo jako atribut. Data obsahující informace o ulicích s geometrií uliční čáry by mohly vypadat například takto:
 +<code>Kód,Název ulice,Kód Obce,Název Obce,Kód Okresu,Název Okresu,WKT_Geometry,CRS
 +442666,Adamovská,554782,Praha,3100,Hlavní město Praha,"LINESTRING(14.450325965881346 50.05789646795757, 14.450948238372803 50.05791713211645, 14.45121645927429 50.05803422884852, 14.451420307159424 50.058764354966634, 14.451624155044554 50.0591569653608, 14.451828002929688 50.059460030836206, 14.45177435874939 50.059522021265785)",http://www.opengis.net/def/crs/EPSG/0/4258
 +442674,Africká,554782,Praha,3100,Hlavní město Praha,"LINESTRING(14.349464178085329 50.09616500163075, 14.349786043167112 50.096075528282334, 14.349968433380127 50.09575892893866, 14.350258111953734 50.09575892893866, 14.350826740264893 50.09566257220141, 14.352350234985352 50.09597228959578, 14.354592561721802 50.096399008059755, 14.355171918869019 50.096392125534024, 14.355483055114746 50.09633018275811, 14.355762004852295 50.09634394782634, 14.358251094818113 50.096791310391346, 14.358723163604736 50.096873899946615, 14.359141588211058 50.09697713669046, 14.359956979751587 50.09699778401253, 14.36085820198059 50.09715607985288, 14.362660646438599 50.09761031718664, 14.363701343536377 50.09788561044452, 14.363905191421507 50.09789937506589, 14.364173412322996 50.09786496350506, 14.364463090896606 50.09773419934845)",http://www.opengis.net/def/crs/EPSG/0/4258
 +442682,Akátová,554782,Praha,3100,Hlavní město Praha,"LINESTRING(14.41953420639038 50.077619800339754, 14.41979169845581 50.077647341221535, 14.421336650848389 50.07749586617591, 14.42479133605957 50.077330620125764, 14.429275989532469 50.07717914407949, 14.431657791137694 50.07711029117297)",http://www.opengis.net/def/crs/EPSG/0/4258
 +</code>
     * [[https://www.esri.com/library/whitepapers/pdfs/shapefile.pdf|ESRI Shapefile]] - je poměrně zastaralý, přesto stále hojně používaný formát pro správu prostorových dat vyvinutý společností ESRI, která uvolnila [[https://www.esri.com/library/whitepapers/pdfs/shapefile.pdf|technickou dokumentaci]] formátu. Jedná se o otevřený formát, který uchovává informace ve více souborech. Vlastnosti jednotlivých prvků dodržují strukturu pro datovou sadu. Organizace spravující data prostřednictvím software od společnosti ESRI by s publikací dat v tomto formátu neměly mít problémy.     * [[https://www.esri.com/library/whitepapers/pdfs/shapefile.pdf|ESRI Shapefile]] - je poměrně zastaralý, přesto stále hojně používaný formát pro správu prostorových dat vyvinutý společností ESRI, která uvolnila [[https://www.esri.com/library/whitepapers/pdfs/shapefile.pdf|technickou dokumentaci]] formátu. Jedná se o otevřený formát, který uchovává informace ve více souborech. Vlastnosti jednotlivých prvků dodržují strukturu pro datovou sadu. Organizace spravující data prostřednictvím software od společnosti ESRI by s publikací dat v tomto formátu neměly mít problémy.
  
Řádek 208: Řádek 207:
  
 Další souřadnicové referenční systémy lze dohledat např. [[http://epsg.io|zde]].  Další souřadnicové referenční systémy lze dohledat např. [[http://epsg.io|zde]]. 
- 
-Problematikou otevírání prostorových dat se podrobně zabývá publikace [[http://opengeolabs.cz/otevrena-geodata/|Otevírání prostorových dat - případová studie]].