standardy:csv

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.


Předchozí verze
standardy:csv [2021/03/18 12:42] (aktuální) – [Formát CSV] Jakub Klímek
Řádek 1: Řádek 1:
 +====== Formát CSV ======
 +
 +Formát CSV (Comma Separated Values [[https://tools.ietf.org/html/rfc4180|IETF RFC4180]], česky čárkou oddělené údaje) je jednoduchý a standardizovaný textový formát pro reprezentaci tabulkových dat.
 +
 +Tabulková data jsou v CSV reprezentována pomocí následujících jednoduchých pravidel:
 +  - Soubor CSV má kódování UTF-8 (ve variantě bez BOM)
 +  - Jednotlivé řádky tabulky jsou zapsány jako řádky textového souboru oddělené pomocí CRLF (znaky s UTF-8 kódy U+000D U+000A)
 +  - Údaje v řádku tabulky jsou zapsány jako řetězce oddělené čárkou (znak '','' s UTF-8 kódem U+002C)
 +  - Pokud údaj sám obsahuje čárku '','', nový řádek ''CRLF'' či uvozovku ''%%"%%'', musí být uzavřen v uvozovkách (znak ''%%"%%'' s UTF-8 kódem U+0022)
 +  - Uvozovku v hodnotě je třeba zdvojit, tj. místo ''%%"%%'' bude zapsána jako ''%%""%%''
 +
 +Příklad tabulkových dat v CSV:
 +<code csv>
 +Poskytovatel,PočetDatovýchSad,PočetDistribucí
 +Český úřad zeměměřický a katastrální,129213,348446
 +Český statistický úřad,511,513
 +HLAVNÍ MĚSTO PRAHA,215,1294
 +</code>
 +===== Nástroje pro práci s CSV =====
 +  * CSV můžete [[http://csvlint.io/|validovat online pomocí CSV Lint]] ([[standardy:technicke-standardy-pro-vytvareni-datovych-schemat-na-stupni-3|nikoliv však jeho schéma!]])
 +  * CSV můžete [[standardy:technicke-standardy-pro-vytvareni-datovych-schemat-na-stupni-3#metadata_vocabulary_for_tabular_data_csv_on_the_web_csvw|standardně a strojově čitelně popisovat pomocí CSV on the Web]]
 +  * CSV můžete otevřít ve vašem tabulkovém procesoru, např. [[https://www.google.com/sheets/about/|Google Sheets]], [[https://www.openoffice.org/product/calc.html|Apache OpenOffice Calc]] či [[https://products.office.com/en/excel|Microsoft Excel]]
 +  * CSV můžete otevřít v libovolném textovém editoru, např. [[https://notepad-plus-plus.org/|Notepad++]] nebo [[https://code.visualstudio.com/|Visual Studio Code]]. Standardní Poznámkový blok ve Windows ovšem vhodný není.
 +  * CSV můžete [[http://codebeautify.org/csv-to-sql-converter|nahrát do relační SQL databáze]]
 +
 +==== Nejčastější chyby při použití formátu CSV ====
 +  - [[standardy:csv:chybné-kódování|Jiné kódování než UTF-8]]
 +  - [[standardy:csv:chybný-oddělovač|Jiný oddělovač než čárka]]
 +  - [[standardy:csv:chybné-escapování|Chybné escapování čárek a uvozovek]]
 +  - [[standardy:csv:mezery-v-číslech|Mezery v zápisu čísel]]
 +  - [[standardy:csv:mezery-v-hodnotách|Mezery použité pro zarovnání]]
 +  - [[standardy:csv:čárky-v-číslech|Desetinná čísla oddělená čárkou]]
 +  - [[standardy:csv:chybné-datumy|Datumy ve formátu jiném než YYYY-MM-DD]]
 +  - [[standardy:csv:jednotky|Jednotky jako součást číselné hodnoty]]
 +  - [[standardy:csv:prázdné-řádky-či-sloupce|Prázdné řádky či sloupce]]
 +  - [[standardy:csv:null|Hodnoty null]]
 +  - [[standardy:csv:implicitní-číselníky|Implicitní číselníky]]
 +  - [[standardy:csv:nekonzistentní-hlavičky|Nekonzistentní hlavičky]]
 +  - [[standardy:csv:chybějící-schéma|Chybějící schéma]] 
 +  - [[standardy:csv:chybný-datový-typ|Chybný datový typ sloupce]]
 +  - [[standardy:csv:seznam-v-buňce|Seznam či strukturovaná hodnota v buňce]]
 +  - [[standardy:csv:chybný-content-type]]