standardy:csv

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revize Předchozí verze
Následující verze
Předchozí verze
standardy:csv [2017/09/04 10:24] Jakub Klímekstandardy:csv [2021/03/18 12:42] (aktuální) – [Formát CSV] Jakub Klímek
Řádek 1: Řádek 1:
 ====== Formát CSV ====== ====== Formát CSV ======
  
-Formát CSV (Comma Separated Values [[https://tools.ietf.org/html/rfc4180|IETF RFC4180]]) je jednoduchý a standardizovaný textový formát pro reprezentaci tabulkových dat.+Formát CSV (Comma Separated Values [[https://tools.ietf.org/html/rfc4180|IETF RFC4180]], česky čárkou oddělené údaje) je jednoduchý a standardizovaný textový formát pro reprezentaci tabulkových dat.
  
 Tabulková data jsou v CSV reprezentována pomocí následujících jednoduchých pravidel: Tabulková data jsou v CSV reprezentována pomocí následujících jednoduchých pravidel:
 +  - Soubor CSV má kódování UTF-8 (ve variantě bez BOM)
   - Jednotlivé řádky tabulky jsou zapsány jako řádky textového souboru oddělené pomocí CRLF (znaky s UTF-8 kódy U+000D U+000A)   - Jednotlivé řádky tabulky jsou zapsány jako řádky textového souboru oddělené pomocí CRLF (znaky s UTF-8 kódy U+000D U+000A)
   - Údaje v řádku tabulky jsou zapsány jako řetězce oddělené čárkou (znak '','' s UTF-8 kódem U+002C)   - Údaje v řádku tabulky jsou zapsány jako řetězce oddělené čárkou (znak '','' s UTF-8 kódem U+002C)
-  - Pokud údaj sám obsahuje čárku, musí být uzavřen v uvozovkách (znak ''%%"%%'' s UTF-8 kódem U+0022) +  - Pokud údaj sám obsahuje čárku '','', nový řádek ''CRLF'' či uvozovku ''%%"%%'', musí být uzavřen v uvozovkách (znak ''%%"%%'' s UTF-8 kódem U+0022) 
-  - Pokud údaj sám obsahuje uvozovku, musí být zdvojena, tj. místo ''%%"%%'' bude zapsána jako ''%%""%%''+  - Uvozovku v hodnotě je třeba zdvojit, tj. místo ''%%"%%'' bude zapsána jako ''%%""%%'' 
 + 
 +Příklad tabulkových dat v CSV: 
 +<code csv> 
 +Poskytovatel,PočetDatovýchSad,PočetDistribucí 
 +Český úřad zeměměřický a katastrální,129213,348446 
 +Český statistický úřad,511,513 
 +HLAVNÍ MĚSTO PRAHA,215,1294 
 +</code> 
 +===== Nástroje pro práci s CSV ===== 
 +  * CSV můžete [[http://csvlint.io/|validovat online pomocí CSV Lint]] ([[standardy:technicke-standardy-pro-vytvareni-datovych-schemat-na-stupni-3|nikoliv však jeho schéma!]]) 
 +  * CSV můžete [[standardy:technicke-standardy-pro-vytvareni-datovych-schemat-na-stupni-3#metadata_vocabulary_for_tabular_data_csv_on_the_web_csvw|standardně a strojově čitelně popisovat pomocí CSV on the Web]] 
 +  * CSV můžete otevřít ve vašem tabulkovém procesoru, např. [[https://www.google.com/sheets/about/|Google Sheets]], [[https://www.openoffice.org/product/calc.html|Apache OpenOffice Calc]] či [[https://products.office.com/en/excel|Microsoft Excel]] 
 +  * CSV můžete otevřít v libovolném textovém editoru, např. [[https://notepad-plus-plus.org/|Notepad++]] nebo [[https://code.visualstudio.com/|Visual Studio Code]]. Standardní Poznámkový blok ve Windows ovšem vhodný není. 
 +  * CSV můžete [[http://codebeautify.org/csv-to-sql-converter|nahrát do relační SQL databáze]] 
 + 
 +==== Nejčastější chyby při použití formátu CSV ==== 
 +  - [[standardy:csv:chybné-kódování|Jiné kódování než UTF-8]] 
 +  - [[standardy:csv:chybný-oddělovač|Jiný oddělovač než čárka]] 
 +  - [[standardy:csv:chybné-escapování|Chybné escapování čárek a uvozovek]] 
 +  - [[standardy:csv:mezery-v-číslech|Mezery v zápisu čísel]] 
 +  - [[standardy:csv:mezery-v-hodnotách|Mezery použité pro zarovnání]] 
 +  - [[standardy:csv:čárky-v-číslech|Desetinná čísla oddělená čárkou]] 
 +  - [[standardy:csv:chybné-datumy|Datumy ve formátu jiném než YYYY-MM-DD]] 
 +  - [[standardy:csv:jednotky|Jednotky jako součást číselné hodnoty]] 
 +  - [[standardy:csv:prázdné-řádky-či-sloupce|Prázdné řádky či sloupce]] 
 +  - [[standardy:csv:null|Hodnoty null]] 
 +  - [[standardy:csv:implicitní-číselníky|Implicitní číselníky]] 
 +  - [[standardy:csv:nekonzistentní-hlavičky|Nekonzistentní hlavičky]] 
 +  - [[standardy:csv:chybějící-schéma|Chybějící schéma]]  
 +  - [[standardy:csv:chybný-datový-typ|Chybný datový typ sloupce]] 
 +  - [[standardy:csv:seznam-v-buňce|Seznam či strukturovaná hodnota v buňce]] 
 +  - [[standardy:csv:chybný-content-type]] 
  • standardy/csv.1504513483.txt.gz
  • Poslední úprava: 2020/06/03 09:36
  • (upraveno mimo DokuWiki)