Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

cinnost:konzultace-pripravy-datove-sady-s-it-specialistou [2015/11/29 00:00] (aktuální)
Řádek 1: Řádek 1:
 +====== Konzultace přípravy datové sady s IT specialistou ======
 +
 +Automatizace přípravy datové sady může výrazně urychlit a zlevnit proces opakovatelné publikace datové sady a pomůže zamezit řadě chyb, které by vznikly při ruční přípravě.
 +
 +Automatizace znamená vytvoření opakovatelně spustitelného skriptu, který vytváří datový soubor v požadované podobě a ukládá jej na domluvené místo, ke kterému má Kurátor dat přístup (lze realizovat i zasláním emailu s datovým souborem v příloze, pokud to jeho velikost dovolí). Skript lze vytvořit např. v následujících případech:​
 +
 +  - Pokud jsou data uložena v databázovém systému (relačním či jiném typu), ke kterému má IT specialista přístup, měl by být schopen vytvořit skript (v případě relační databáze to může být sada SQL příkazů),​ který data z databáze extrahuje a uloží do souboru v požadované podobě.
 +  - Pokud jsou data uložena v databázovém systému, ke kterému IT specialista nemá přístup, protože jej dodavatel neudělil, je nutno zajistit, aby dodavatel přístup k systému dodatečně udělil nebo je nutno se s žádostí o vytvoření skriptu na dodavatele obrátit.
 +  - Pokud jsou data IT specialistovi přístupná pouze prostřednictvím datového API a není možné mu zajistit přístup přímo k databázi, prodiskutujte s ním možnost vytvoření datového souboru pomocí sady dotazů do datového API. Pokud API umožňuje získat seznam všech datových položek datové sady (např. řádků tabulky) a poté detailní data ke každé datové sadě, měl by být IT specialista schopen skript vytvořit. Takové funkce běžně datová API nabízejí.
 +  - Pokud jsou již data v nějakém datovém souboru uložena a je nutné je převést do jiné podoby, lze přímočaré transformace automatizovat. Zejména by měl být IT specialista schopen pomocí skriptu automatizovat následující operace:
 +    * konverze jednoduché tabulky uložené v datovém souboru tabulkového editoru (např. XLS(X), ODS, atd.) do formátu CSV.
 +    * konverze formátu (CSV, XML či JSON) do jiného formátu (CSV, XML či JSON),
 +    * přejmenování datových prvků (přejmenování sloupců v CSV souboru, přejmenování elementů v XML či JSON souboru),
 +    * konverze datových typů (např. konverze jednoho formátu datumů do jiného formátu).