Formát CSV

Formát CSV (Comma Separated Values IETF RFC4180, česky čárkou oddělené údaje) je jednoduchý a standardizovaný textový formát pro reprezentaci tabulkových dat.

Tabulková data jsou v CSV reprezentována pomocí následujících jednoduchých pravidel:

  1. Soubor CSV má kódování UTF-8
  2. Jednotlivé řádky tabulky jsou zapsány jako řádky textového souboru oddělené pomocí CRLF (znaky s UTF-8 kódy U+000D U+000A)
  3. Údaje v řádku tabulky jsou zapsány jako řetězce oddělené čárkou (znak , s UTF-8 kódem U+002C)
  4. Pokud údaj sám obsahuje čárku, musí být uzavřen v uvozovkách (znak " s UTF-8 kódem U+0022)
  5. Pokud údaj sám obsahuje uvozovku, musí být zdvojena, tj. místo " bude zapsána jako ""

Nejčastější chyby při použití formátu CSV