standardy:csv

Formát CSV

Formát CSV (Comma Separated Values IETF RFC4180, česky čárkou oddělené údaje) je jednoduchý a standardizovaný textový formát pro reprezentaci tabulkových dat.

Tabulková data jsou v CSV reprezentována pomocí následujících jednoduchých pravidel:

  1. Soubor CSV má kódování UTF-8 (ve variantě bez BOM)
  2. Jednotlivé řádky tabulky jsou zapsány jako řádky textového souboru oddělené pomocí CRLF (znaky s UTF-8 kódy U+000D U+000A)
  3. Údaje v řádku tabulky jsou zapsány jako řetězce oddělené čárkou (znak , s UTF-8 kódem U+002C)
  4. Pokud údaj sám obsahuje čárku ,, nový řádek CRLF či uvozovku ", musí být uzavřen v uvozovkách (znak " s UTF-8 kódem U+0022)
  5. Uvozovku v hodnotě je třeba zdvojit, tj. místo " bude zapsána jako ""

Příklad tabulkových dat v CSV:

Poskytovatel,PočetDatovýchSad,PočetDistribucí
Český úřad zeměměřický a katastrální,129213,348446
Český statistický úřad,511,513
HLAVNÍ MĚSTO PRAHA,215,1294
  • standardy/csv.txt
  • Poslední úprava: 2021/03/18 11:42
  • autor: Jakub Klímek