Příprava datové sady k publikaci

Ve zkratce: Jaké zvolit podoby a formáty datové sady, jak zkontrolovat jejich správnost a jak aktualizovat publikované datové sady a záznamy o nich?

Po provedení analýzy Kurátor dat připraví datovou sadu k publikaci. To znamená připravit distribuci datové sady (příp. více distribucí, pokud se Kurátor při analýze rozhodl rozdělit obsah datové sady do více distribucí či publikovat obsah datové sady ve více různých formátech). Příprava distribuce znamená buď vytvořit novou distribuci, nebo aktualizovat již jednou publikovanou. Připravenou distribuci Kurátor dat předá Koordinátorovi otevírání dat spolu s připraveným záznamem o datové sadě k formální kontrole a k zajištění zveřejnění.

Při přípravě distribuce je nutno dodržet pravidla zvoleného stupně otevřenosti a datového formátu a také strukturu danou zvoleným či vytvořeným datových schématem.

Často se stává, že data tvořící datovou sadu již existují v datových souborech. Ty však nelze přímo zveřejnit, protože jejich formát odpovídá nižšímu stupni otevřenosti, než byl zvolen pro publikaci.

Distribuci či distribuce datové sady je nutno pravidelně aktualizovat dle nastavené periodicity aktualizace v záznamu o datové sadě. Aktualizace znamená buď aktualizace již jednou publikované distribuce, nebo vytvoření nové distribuce obsahující aktualizaci (tj. nově přidané záznamy, změny v již publikovaných záznamech včetně informace o odstranění existujících záznamů).

Přípravu datového souboru lze zajistit ručně nebo ji lze automatizovat. Možnosti automatizace by měl Kurátor dat konzultovat s IT specialistou.

Poté, co je datový soubor připraven, by měl Kurátor dat zkontrolovat, že formát datového souboru je v pořádku a že jeho struktura odpovídá navrženému datovému schématu. Kontrolu nazýváme validace datového souboru. Jedná se o technickou záležitost. Pokud nemá Kurátor dat dostatečné technické znalosti, je třeba, aby validaci provedl IT specialista.

Dále může být potřeba aktualizovat atributy záznamu o datové sadě. Datový soubor je v záznamu o datové sadě reprezentován jako distribuce datové sady. Pokud existuje pro datovou sadu pouze jeden aktualizovaný datový soubor, je třeba aktualizovat atributy příslušné distribuce. Pokud je v každé periodě vytvářen nový datový soubor, je třeba rozšířit záznam o datové sadě o novou distribuci.

  • cinnost/priprava-datove-sady-k-publikaci.txt
  • Poslední úprava: 2023/04/09 09:41
  • autor: Jakub Klímek