Formát CSV

Formát CSV (Comma Separated Values IETF RFC4180, česky čárkou oddělené údaje) je jednoduchý a standardizovaný textový formát pro reprezentaci tabulkových dat.

Tabulková data jsou v CSV reprezentována pomocí následujících jednoduchých pravidel:

  1. Soubor CSV má kódování UTF-8
  2. Jednotlivé řádky tabulky jsou zapsány jako řádky textového souboru oddělené pomocí CRLF (znaky s UTF-8 kódy U+000D U+000A)
  3. Údaje v řádku tabulky jsou zapsány jako řetězce oddělené čárkou (znak , s UTF-8 kódem U+002C)
  4. Pokud údaj sám obsahuje čárku, musí být uzavřen v uvozovkách (znak " s UTF-8 kódem U+0022)
  5. Pokud údaj sám obsahuje uvozovku, musí být zdvojena, tj. místo " bude zapsána jako ""

Příklad tabulkových dat v CSV:

Poskytovatel,PočetDatovýchSad,PočetDistribucí
Český úřad zeměměřický a katastrální,129213,348446
Český statistický úřad,511,513
HLAVNÍ MĚSTO PRAHA,215,1294

Nejčastější chyby při použití formátu CSV