Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

cinnost:publikace-kolekce-dokumentu [2015/11/28 00:00] (aktuální)
Řádek 1: Řádek 1:
 +====== Publikace kolekce dokumentů v podobě otevřené datové sady ======
 +
 +Často chtějí poskytovatelé dat publikovat ne strukturovaná data, ale textové dokumenty. Často se stává, že se jedná o kolekci dokumentů stejného typu, např. kolekci smluv. Pokud by byla zveřejněna pouze kolekce, bylo by pro vývojáře aplikací nad takovou datovou sadou náročně vytvářet aplikace. Pro dokumenty v kolekci lze často nalézt společnou množinu atributů, které lze evidovat pro každý dokument v kolekci (např. pro každou smlouvu lze evidovat její název, datum uzavření, celkovou částku, IČ dodavatele, atd.). Pro takovou kolekci je vhodné vytvořit novou datovou sadu, která usnadní vývojářům případných aplikací zpracování zveřejněné kolekce.
 +
 +  - Samotnou kolekci dokumentů zveřejněte jako datovou sadu na úrovni **1***. Datový soubor pro zveřejnění vytvořte jako archiv ve formátu ZIP (či jiném podobném) do nějž kolekci umístěte.
 +    * Buď založte pouze jeden ZIP archiv obsahující celou kolekci, do kterého v každé periodě přidáváte nové dokumenty. ​
 +    * Nebo zakládejte v každé periodě nový ZIP archiv obsahující vždy kolekci dokumentů, které v dané periodě vznikly.
 +  - Navíc založte novou datovou sadu na úrovni **3*** v podobě tabulky. Sloupečky tabulky budou odpovídat atributům, které budete pro každý dokument v kolekci evidovat. Tabulku evidujte v datovém souboru ve formátu CSV.
 +    * Udržujte pouze jeden datový soubor s tabulkou, který v každé periodě aktualizujte přidáním nových řádků odpovídajících dokumentům,​ které v dané periodě nově přibyly.