draft:technicke-standardy-pro-datove-sady-na-stupni-3

Toto je starší verze dokumentu!


Draft

Poznámky, které je třeba zapracovat

Rastrová data – zmínit v předchozí subsekci (obrazová data).

Konec poznámek

Specifickou kapitolou jsou prostorová data, kde je oproti ostatním typům dat potřeba počítat s prostorovou složkou. Prostorová data zahrnují všechny typy dat, které jsou prostorově určeny. Jsou zpravidla určena geometrickým objektem. Obecně lze prostorová data rozdělit na vektorová a rastrová. Standardizace otevřených prostorových dat je zaštítěna pracovní skupinou ISO/TC 211 a mezinárodní standardizační organizací Open Geospatial Consortium (OGC). Správa prostorových dat, včetně jejich publikace, popisu metadaty atd. je u větších organizací zajištěna vybudováním komplexní infrastruktury prostorových dat (Spatial Data Infrastructure – SDI). SDI umožňuje poskytování dat prostřednictvím standardizovaných služeb, jejich vyhledávání v katalogu pomocí klíčových slov a územního rozsahu a umožňuje například transformaci dat mezi jednotlivými formáty nebo souřadnicovými referenčními systémy. V případě menších obcí a organizací není budování SDI nezbytné, data lze poskytovat například vystavením souborů na internet, je však potřeba data pravidelně aktualizovat. Doporučujeme také vytvořit alespoň webovou stránku, která poskytovaná data popisuje.

Na obecní úrovni mohou být datovými sadami, které je vhodné publikovat jako prostrová data, například seznam památných stromů nebo pomníků (bodová data), lokální cestní nebo inženýrská síť (liniová data), přehled obecní zeleně nebo územní plán (plošná data). Vektorová data by měla být publikována ve vhodném otevřeném formátu za použití standardizovaných prostorových objektů. Reprezentace prostorových objektů bývá zpravidla popsána ve standardu formátu, proto je vhodné si před implementací standard alespoň zběžně prostudovat, zpravidla se však pro reprezentaci prostorových objektů používá buď standard Geography Markup Language (GML), nebo Well-Known Text (WKT). Je krajně nevhodné reprezentovat prostorovou složku použitím atributů „lat“ a „lon“, respektive „x“ a „y“, nebo podobné. Tato reprezentace nemusí obsahovat některé důležité informace o objektu (jako je například souřadnicový referenční systém) a není schopná reprezentovat jiné než bodové prvky.

Prostorové objekty

K vyjádření geometrického objektu je vhodné používat buď WKT, nebo GML interpretaci.

Well-Known Text (WKT) – formát byl vytvořen OGC a je specifikován ve standardech Simple Feature Access a ISO 19125. Je vhodný především k zápisu 2D geometrií, jako je point, multipoint, line, polyline, polygon a pod. Přestože je ve WKT možné definovat souřadnicové systémy a používat je pro reprezentované objekty, nejčastěji je WKT používán pro reprezentaci souřadnic v souřadnicovém systému WGS 84.

Geography Mark-up Language (GML) – formát je rozšířením značkovacího jazyka XML za účelem reprezentace geometrických objektů. Je definován ve standardu OGC Geography Markup Language a proti WKT je velice robustní. Umožňuje zápis souřadnic v mnoha souřadnicových systémech (pro ČR je nejdůležitější podpora souřadnicového referenčního systému S-JTSK) a umožňuje reprezentaci všech forem prostorových informací, včetně pokryvu nebo senzorových dat. Větší robustnost je vykoupena větší složitostí zápisu.

Základními prostorovými objekty jsou:

Point

Objekt je reprezentován bodem. Možný je i Multipoint – v případě, že je objekt reprezentován množinou bodů. Reprezentace ve WKT:

POINT(50.056 14.434)

Reprezentace v GML:

<gml:Point srsName="urn:ogc:def:crs:EPSG::4326" srsDimension="2">
    <gml:pos>50.056 14.434</gml:pos>
</gml:Point>
Polyline

Objekt je reprezentován lomenou čárou (například uliční čára, osa vodního toku). Reprezentace ve WKT:

LINESTRING(50.056 14.434, 50.064 14.442, 50.042 14.445)

Reprezentace v GML:

<gml:Curve srsName="urn:ogc:def:crs:EPSG::5514" srsDimension="2">
    <gml:segments>
      <gml:LineStringSegment>
        <gml:posList>-641126.76 -1093821.18 -641119.35 -1093831.05 -641109.75 -1093844.44</gml:posList>
      </gml:LineStringSegment>
    </gml:segments>
</gml:Curve>

nebo

<gml:Curve srsName="urn:ogc:def:crs:EPSG::5514" srsDimension="2">
    <gml:segments>
      <gml:LineStringSegment>
        <gml:coordinates>-641126.76, -1093821.18 -641119.35, -1093831.05 -641109.75, -1093844.44</gml:coordinates>
      </gml:LineStringSegment>
    </gml:segments>
</gml:Curve>
Polygon

Objekt je reprezentován plochou, plochami, případně plochou s dírou (například plocha zeleně, vodní plocha, plocha parcely). Reprezentace ve WKT:

POLYGON(14.402751 50.088131, 14.402749 50.088105, 14.402738 50.088104, 14.402742 50.088099, 14.402746 50.088089, 14.402751 50.088082, 14.402744 50.088079, 14.40275 50.088075, 14.402748 50.088053, 14.402742 50.088053, 14.402748 50.088044, 14.402744 50.088041, 14.402739 50.08804, 14.402732 50.088033, 14.402739 50.088032, 14.402733 50.088021, 14.402728 50.08801, 14.402746 50.088002, 14.402749 50.087994, 14.402751 50.08799, 14.402746 50.087988, 14.402752 50.087984, 14.402749 50.087954, 14.402754 50.087951, 14.40275 50.087945, 14.402743 50.087943)

Reprezentace v GML:

<gml:Polygon gml:id="CPX.2384051101" srsName="EPSG:4326" srsDimension="2">
  <gml:exterior>
    <gml:LinearRing>
      <gml:posList>14.402751 50.088131 14.402749 50.088105 14.402738 50.088104 14.402742 50.088099 14.402746 50.088089 14.402751 50.088082 14.402744 50.088079 14.40275 50.088075 14.402748 50.088053 14.402742 50.088053 14.402748 50.088044 14.402744 50.088041 14.402739 50.08804 14.402732 50.088033 14.402739 50.088032 14.402733 50.088021 14.402728 50.08801 14.402746 50.088002 14.402749 50.087994 14.402751 50.08799 14.402746 50.087988 14.402752 50.087984 14.402749 50.087954 14.402754 50.087951 14.40275 50.087945 14.402743 50.087943</gml:posList>
    </gml:LinearRing>
  </gml:exterior>
</gml:Polygon>

Vektorové formáty

tady jsem skončil

Podle velikosti obcí a organizací - resp. přítomnosti oddělení GIS v rámci jejich organizační struktury - mohou být použity postupy a datové formáty dostupné v jejich IT infrastruktuře.

U malých obcí či organizací je celkem zbytečné budovat komplexní prostorovou infrastrukturu (Spatial Data Infrastructure - SDI). V případě, že obec či organizace nějakým způsobem spravuje data s prostorovou složkou (tj. geografická data, geodata), ať už bodová (jako např. seznam památných stromů nebo pomníků), liniová (lokální cestní síť) nebo plošná (přehled obecní zeleně) a chce tyto datové sady otevřít, měla by k tomu zvolit vhodný souborový formát:

  • Comma Separated Values (CSV, IETF RFC4180) - jednotlivé záznamy atributové tabulky jsou zapsány jako řádky textového souboru a hodnoty záznamů jako řetězce oddělené čárkou (znak UTF-8 s kódem U+002C), přičemž hodnota může být uzavřena v uvozovkách (znak UTF-8 s kódem U+0022), především pokud hodnota sama obsahuje jednu nebo více čárek. Položky s prostorovou informací mohou být vyjádřeny souřadnicemi, pokud se jedná o bodová data. U ostatních typů dat jako jsou liniová anebo polygonová data může být použit zápis WKT (viz Poznámka k zápisu geometrie). Dále by měl být tento zápis opatřen informací o souřadnicovém systému ve formě EPSG kódu (viz Poznámka k souřadnicovým systémům), např. v hlavičce souboru.
  • ESRI Shapefile - vlastnosti jednotlivých prvků dodržují strukturu pro datovou sadu.
  • Geography Markup Language (OGC GML) - jedná se formát XML pro prostorová data. Atributy prvků reflektují strukturu datové sady.
  • GeoJSON - formát, kde jsou jednotlivé záznamy atributové tabulky reprezentovány jako samostatné JSON objekty strukturované dle hlavičky reprezentované tabulky a navíc obsahují prostorovou informaci.
  • OGC GeoPackage - je nad souborovou databází SQLite postavený standardizovaný formát pro prostorová data. Lze do něj uložit stejnou strukturu jako do CSV a složitou geometrickou strukturu jako samostatný atribut.

Datové sady jsou publikovány tak, že všechny prvky (prostorové objekty) v datové sadě mají stejnou strukturu (stejné atributy).

Pokud jsou některá data organizaci nebo obci poskytována externím subjektem - např. firmou zpracovávající územní plán - měli by jednatelé trvat na odevzdání práce v otevřeném formátu pro prostorová data (viz seznam níže). Takovou datovou sadu lze pak bez dalšího úsilí otevřít. Podstatné je v této souvislosti se pokud možno vyhnout uzavřeným formátům (např. DWG, DGN, ESRI GeoDatabase, …). Případně datové sady v těchto formátech převést před otevřením do výše doporučených otevřených formátů.

Je také vhodné udržovat systém metadat k datových sadám (jejich slovní popis, označení původu, datum vzniku, licenci a tak dále) např. v samostatném souboru. Datové sady lze zveřejnit „tak jak jsou“ (pokud možno v otevřeném formátu, jak je zmíněno výše) na webových stránkách ve formě odkazů na soubory. K tomu není ani nutné pořizovat často nákladné webové mapové portály.

V případě publikace rozsáhlejší datové sady formou souborů je vhodné doplnit tyto soubory o Atom feed nebo je publikovat prostřednictvím webových služeb OGC. Tyto způsoby publikace umožňují jednodušší vyhledávaní konkrétních dat v rámci datové sady.

U obcí s rozšířenou působností (ORP) a větších, je možné publikovat data v souladu se směrnicí INSPIRE (zákon č. 380/2009 Sb. http://inspire.gov.cz/) pomocí webových služeb OGC:

Data poskytovaná těmito službami lze použít pro další GIS analýzy, neboť se jedná o geodata. Pro vektorová data (passporty zeleně, silniční síť, mapu veřejných záchodků apod.) je vhodné použití OGC Web Feature Service, pro rastrová data (např. letecké snímky) potom OGC Web Coverage Service.

Dále lze doporučit i další OGC webové služby WMS (Web Map Service) a WMTS (Web Map Tile Service). Nejedná se však o otevřený způsob distribuce dat, neboť tyto služby neposkytují geodata, ale pouze jejich otisk ve formě obrázku. Takto poskytovaná data nelze dále analyzovat prostřednictvím GIS nástrojů. Služby OGC WMS a WMTS jsou vhodné pro tvorbu webových mapových aplikací a pro využití desktopovými GIS programy jako podkladové mapy.

Při použití webových služeb OGC je třeba dodržet vhodné nastavení serveru s ohledem na podporované souřadnicové systémy, na jeho očekávanou vytíženost či bezpečnostní rizika apod.

Větší organizace veřejné správy s pokročilou infrastrukturou pro prostorová data (SDI) publikující metadata k prostorovým datovým sadám v souladu se standardem OGC CSW propojí tato metadata do portálu otevřených dat.

Poznámka k proprietárním službám

Některé nástroje GIS obsahují proprietární služby pro publikaci dat. Data publikovaná prostřednictvím těchto služeb nelze považovat za dostatečně otevřená. Nebývají podporována existujícími softwary třetích stran, licenční podmínky jejich využití nejsou často transparentní. Jedná se například o tzv. REST API v softwarech firmy ESRI.

Poznámka k souřadnicovým systémům

EPSG - je uznávaný registr mimo jiné pro popis souřadnicových systémů, podporovaný všemi programy pro práci s prostorovými daty (GIS). Relevantní hodnoty pro Českou republiku jsou

  • 5514 - Systém jednotné trigonometrické sítě katastrální (S-JTSK) - používaný např. v katastru nemovitostí. Pro tento systém je mimo jiné v GIS typické, že souřadnice nabývají negativních hodnot (jsou uvozeny znaménkem minus).
  • 4326 - World Geodetic System 1984 (WGS84), někdy zvaný též “souřadnice GPS”. Souřadnice bývají uvedeny ve stupních s desetinným číslem. Některé publikační formáty (např. GPX nebo KML) počítají přímo s tím, že data jsou uložena v tomto souřadnicovém systému.
  • 3857 - tzv. Web (nebo též Google) Mercator - je systém používaný na většině globálních webových aplikací. Jeho nevýhodou je mimo jiné zkreslení významné velikosti ploch směrem k pólům.

Další lze dohledat např. na stránce http://epsg.io

Poznámka k zápisu geometrie

WKT - Well Known Text - je standardní formát zápisu vektorové geometrie. Popis je mimo jiné k nalezení ve specifikaci OGC Simple Features.

Typ Příklad
Bod POINT (30 10)
Linie LINESTRING (30 10, 10 30, 40 40)
Polygon POLYGON ( (30 10, 40 40, 20 40, 10 20, 30 10) )

Pomocí WKT lze samozřejmě uložit i komplikovanější datové typy, jako jsou MULTIPOINTS či CompoundCurve a další.

Pokud uvažujete o použití WKT pro popis atributu geometrie u objektů, zvažte publikaci otevřené datové sady v některém k tomu určeném otevřeném formátu (ESRI Shapefile, KML, OGC GeoPackage nebo GeoJSON).

Problematikou otevírání prostorových dat se podrobně zabývá publikace Otevírání prostorových dat - případová studie.

  • draft/technicke-standardy-pro-datove-sady-na-stupni-3.1529416537.txt.gz
  • Poslední úprava: 2020/06/03 09:36
  • (upraveno mimo DokuWiki)