Následující verze | Předchozí verze Následující verzeObě strany příští revize |
standardy:csv [2017/09/04 09:47] – vytvořeno Jakub Klímek | standardy:csv [2020/08/05 13:38] – [Nástroje pro práci s CSV] Jakub Klímek |
---|
====== Formát CSV ====== | ====== Formát CSV ====== |
| |
Comma Separated Values (CSV, [[https://tools.ietf.org/html/rfc4180|IETF RFC4180]]), kde jednotlivé řádky tabulky jsou zapsány jako řádky textového souboru a údaje v řádku tabulky jsou zapsány jako řetězce oddělené čárkou (znak s UTF-8 kódem U+002C), přičemž hodnota může být uzavřena v uvozovkách (znak s UTF-8 kódem U+0022), především pokud hodnota sama obsahuje jednu nebo více čárek. | Formát CSV (Comma Separated Values [[https://tools.ietf.org/html/rfc4180|IETF RFC4180]], česky čárkou oddělené údaje) je jednoduchý a standardizovaný textový formát pro reprezentaci tabulkových dat. |
| |
| Tabulková data jsou v CSV reprezentována pomocí následujících jednoduchých pravidel: |
| - Soubor CSV má kódování UTF-8 |
| - Jednotlivé řádky tabulky jsou zapsány jako řádky textového souboru oddělené pomocí CRLF (znaky s UTF-8 kódy U+000D U+000A) |
| - Údaje v řádku tabulky jsou zapsány jako řetězce oddělené čárkou (znak '','' s UTF-8 kódem U+002C) |
| - Pokud údaj sám obsahuje čárku, musí být uzavřen v uvozovkách (znak ''%%"%%'' s UTF-8 kódem U+0022) |
| - Pokud údaj sám obsahuje uvozovku, musí být zdvojena, tj. místo ''%%"%%'' bude zapsána jako ''%%""%%'' |
| |
| Příklad tabulkových dat v CSV: |
| <code csv> |
| Poskytovatel,PočetDatovýchSad,PočetDistribucí |
| Český úřad zeměměřický a katastrální,129213,348446 |
| Český statistický úřad,511,513 |
| HLAVNÍ MĚSTO PRAHA,215,1294 |
| </code> |
| ===== Nástroje pro práci s CSV ===== |
| * CSV můžete [[http://csvlint.io/|validovat online pomocí CSV Lint]] ([[standardy:technicke-standardy-pro-vytvareni-datovych-schemat-na-stupni-3|nikoliv však jeho schéma!]]) |
| * CSV můžete [[https://www.w3.org/standards/techs/csv#w3c_all|standardně a strojově čitelně popisovat pomocí CSV on the Web]] |
| * CSV můžete otevřít ve vašem tabulkovém procesoru, např. [[https://www.google.com/sheets/about/|Google Sheets]], [[https://www.openoffice.org/product/calc.html|Apache OpenOffice Calc]] či [[https://products.office.com/en/excel|Microsoft Excel]] |
| * CSV můžete otevřít v libovolném textovém editoru, např. [[https://notepad-plus-plus.org/|Notepad++]] nebo [[https://code.visualstudio.com/|Visual Studio Code]]. Standardní Poznámkový blok ve Windows ovšem vhodný není. |
| * CSV můžete [[http://codebeautify.org/csv-to-sql-converter|nahrát do relační SQL databáze]] |
| |
| ==== Nejčastější chyby při použití formátu CSV ==== |
| - [[standardy:csv:chybné-kódování|Jiné kódování než UTF-8]] |
| - [[standardy:csv:chybný-oddělovač|Jiný oddělovač než čárka]] |
| - [[standardy:csv:chybné-escapování|Chybné escapování čárek a uvozovek]] |
| - [[standardy:csv:mezery-v-číslech|Mezery v zápisu čísel]] |
| - [[standardy:csv:mezery-v-hodnotách|Mezery použité pro zarovnání]] |
| - [[standardy:csv:čárky-v-číslech|Desetinná čísla oddělená čárkou]] |
| - [[standardy:csv:chybné-datumy|Datumy ve formátu jiném než YYYY-MM-DD]] |
| - [[standardy:csv:jednotky|Jednotky jako součást číselné hodnoty]] |
| - [[standardy:csv:prázdné-řádky-či-sloupce|Prázdné řádky či sloupce]] |
| - [[standardy:csv:null|Hodnoty null]] |
| - [[standardy:csv:implicitní-číselníky|Implicitní číselníky]] |
| - [[standardy:csv:nekonzistentní-hlavičky|Nekonzistentní hlavičky]] |
| - [[standardy:csv:chybějící-schéma|Chybějící schéma]] |
| - [[standardy:csv:chybný-datový-typ|Chybný datový typ sloupce]] |
| - [[standardy:csv:seznam-v-buňce|Seznam či strukturovaná hodnota v buňce]] |
| - [[standardy:csv:chybný-content-type]] |