Analýza datové sady a návrh technického způsobu jejího zveřejnění

Ve zkratce: Co je potřeba udělat s datovou sadou před jejím zveřejněním?

Před samotnou publikací datové sady je nutné ji analyzovat. Analýzu zajišťuje její Kurátor dat. Analyzuje obsah a strukturu datové sady. Na základě analýzy pak (ve spolupráci s IT specialistou) navrhuje:

  • věcný obsah datové sady
  • stupeň otevřenosti, na kterém bude datová sada zveřejněna
  • datové schéma určující strukturu, ve které bude datová sada zveřejněna
  • záznam o datové sadě

Při provádění vlastní analýzy by měl Kurátor dat nejprve určit věcný obsah datové sady, tj. o jakých entitách datová sada bude. Příkladem mohou být Faktury, kde kurátor bude chtít publikovat jejich položky, dodavatele a odběratele.

Pokud pro danou množinu dat již existuje Otevřená formální norma, lze ji pro definici obsahu datové daty použít, případně rozšířit. Pokud zatím taková otevřená formální norma neexistuje, lze ve spolupráci s MVČR vytvořit novou. Ta bude využívat existující sdílené specifikace pro nejčastěji se vyskytující části dat.

Dále by měl Kurátor dat určit stupeň otevřenosti datové sady. Minimální stupeň otevřenosti je stupeň 3.

Dále je třeba pro datovou sadu navrhnout její strojově čitelné datové schéma. Datové schéma popisuje strukturu jednotlivých položek datové sady. Jeho tvorba je technickou záležitostí. Pokud nemá Kurátor dat dostatečné technické znalosti, musí tuto činnost převzít určený IT specialista. Přístup k tvorbě schématu datové sady se liší dle zvoleného stupně otevřenosti.

V posledním kroku analýzy připraví Kurátor záznam o datové sadě, který bude při jejím zveřejnění publikován v datovém katalogu.

  • cinnost/analyza-datove-sady.txt
  • Poslední úprava: 2023/04/09 09:41
  • autor: Jakub Klímek