Rozhodnutí o způsobu katalogizace otevřených dat

Ve zkratce: možnosti, jak zajistit dohledání publikovaných datových sad; zaevidování do Národního katalogu otevřených dat; výhody a nevýhody vytvoření lokálního katalogu.

Zásadní vlastností otevřených dat je, že jsou veřejností snadno dohledatelná. Katalog otevřených dat je prostředek, který dohledatelnost významně usnadňuje. Je důležité, aby všechny datové sady poskytovatele byly katalogizovány v alespoň jednom datovém katalogu.

Povinná pro každého Poskytovatele dat je katalogizace v Národním katalogu otevřených dat (NKOD), který provozuje Ministerstvo vnitra České republiky na Portálu veřejné správy (PVS).

Poskytovatel může na svých WWW stránkách provozovat svůj vlastní lokální katalog otevřených dat, ve kterém bude katalogizovat svoje datové sady. Pokud navíc lokální katalog splňuje technické parametry popsané v těchto standardech, nemusí poskytovatel předávat záznamy do NKOD ručně. Je možné zajistit automatickou synchronizaci obsahu lokálního katalogu s NKOD. Více zde.

Při rozhodování o způsobu katalogizace doporučujeme spolupracovat s IT specialistou a postupovat podle Otevřené formální normy pro rozhraní katalogů otevřených dat a podle následujících kritérií:

  • Pokud poskytujete jen malé množství datových sad (do 10), zvolte možnost katalogizovat datové sady přímo v Národním katalogu otevřených dat (NKOD).
  • Pokud poskytujete více datových sad, provozujte vlastní lokální katalog otevřených dat. Při volbě způsobu provozu lokálního katalogu postupujte následovně:
    • Pokud jste schopni metadatové záznamy generovat podle standardu DCAT-AP a poskytovat je ve SPARQL endpointu či alespoň jako statické soubory obsahující DCAT-AP záznamy, toto je preferované řešení pro NKOD. Stačí dodržet Otevřenou formální normu pro rozhraní katalogů otevřených dat. V současnosti ale neexistuje hotové nasaditelné řešení, které by zajišťovalo i sběr metadat o datových sadách a management jejich záznamů. To je v této variantě ponecháno na poskytovateli.
    • Pokud varianta DCAT-AP není schůdná, a na svém serveru již provozujete nebo můžete provozovat technologie Linux, Python, Java, PostgreSQL a nebo chcete záznamy o datových sadách automaticky aktualizovat pomocí jiného software ⇒ Provozujte vlastní lokální katalog na zřízené doméně postavený na technologii CKAN
    • Na svém serveru již provozujete nebo můžete provozovat technologie PHP a MySQL a stačí vám spravovat záznamy o datových sadách ručně ⇒ Provozujte vlastní lokální katalog na zřízené doméně postavený na technologii DKAN.
    • Nemůžete nebo nechcete zasahovat do svých webových serverů, ale můžete si pořídit levný externí webhosting s podporou PHP a MySQL a stačí vám spravovat záznamy o datových sadách ručně ⇒ Provozujte vlastní lokální katalog na zřízené doméně na externím webhostingu na technologii DKAN.

Pokud budete provozovat vlastní lokální katalog otevřených dat (na bázi technologií DKAN/CKAN), nemusíte navíc ručně katalogizovat jednotlivé datové sady v NKOD. Postačí v NKOD svůj katalog zaregistrovat (viz Registrace vlastního katalogu v NKOD).

Pro rozhodování můžete použít následující modelové situace:

  • Obec provozuje jednoduchou WWW stránku se základními informacemi o obci.
  • Nemá možnost ani prostředky nijak WWW stránku rozšiřovat.
  • Nemá možnost na WWW stránce publikovat datové soubory ke stažení.
  • Nechce pracovat v cizojazyčném prostředí a chce garanci, že zvolený způsob katalogizace bude fungovat a nebude měněn.
  • Ke katalogizaci datových sad volí možnost katalogizovat datové sady pomocí NKOD.
  • Ministerstvo má možnost zřídit subdoménu (např. data.ministerstvo.cz) a na ní zprovoznit technologie PHP a MySQL, ale nemá zavedené vnitřní mechanizmy práce s daty a není schopno je zavést.
  • Ke katalogizaci datových sad volí možnost provozovat vlastní lokální datový katalog postavený na technologii DKAN. Každopádně zajistí soulad s Otevřenou formální normou pro rozhraní katalogů otevřených dat.