Mezery použité pro zarovnání hodnot

Je třeba si připomenout, že otevřená data jsou určena pro vývojáře aplikací, aby se jim s daty pracovalo co nejsnáze. Soubor CSV neobsahuje žádnou podporu pro formátování, a je to tak dobře, jelikož z hlediska použití dat je formátování irelevantní a pouze zesložiťuje práci s daty.

V následujícím fragmentu se autor souboru soustředil na zarovnání sloupců pro jejich „hezké“ zobrazení v textovém editoru. Soubory CSV ale nejsou určeny pro pro prohlížení lidmi v textovém editoru, jsou určeny pro strojové zpracování. Nástroje pro zpracování CSV pak vidí například hodnotu 1 místo 1, a nejsou schopny hodnotu zpracovat jako číslo.

name     ,  rank,   score, probability, sas_points, surf_atoms,   center_x,   center_y,   center_z, residue_ids, surf_atom_ids
pocket1  ,     1,    8.71,       0.300,         74,         43,     9.9787,     2.8731,    21.9327, A_140 A_141 A_142 A_143 A_144 A_145 A_163 A_164 A_165 A_166 A_187 A_188 A_25 A_26 A_27 A_41 A_44 A_49, 178 179 183 191 194 307 308 309 310 311 312 332 353 354 1064 1065 1074 1075 1080 1081 1084 1085 1086 1088 1089 1097 1102 1103 1245 1249 1257 1260 1262 1264 1267 1268 1422 1423 1424 1425 1429 1431 1432
pocket2  ,     2,    4.12,       0.088,         54,         27,   -15.7343,    -7.4354,    11.2468, A_107 A_108 A_109 A_110 A_132 A_200 A_202 A_240 A_246 A_249 A_292 A_293, 821 828 829 830 834 835 836 842 845 1006 1518 1519 1533 1853 1854 1855 1856 1903 1905 1906 1928 1929 2238 2240 2245 2246 2247
pocket3  ,     3,    2.36,       0.028,         36,         21,   -12.6370,     2.9140,     8.8884, A_104 A_106 A_110 A_111 A_151 A_153 A_158 A_292 A_294 A_295, 796 797 815 844 845 849 851 1140 1141 1142 1143 1156 1197 1198 2239 2240 2253 2254 2256 2258 2265

V následujícím fragmentu jsou data v sloupci Name vyplněny mezerami. Potenciálnímu uživateli to způsobí problémy, protože název nemohou použít ve svých aplikacích tak, jak je, ale musí z něj mezery nejpre odřezávat.

Id;Name;NameShort;PremiereDt;DerniereDt;TheatreId;StageId;EnsemleId
1;;Antigona                      ;199511 3;;231;674;
2;;Ten, který dostává políčky    ;19951030;;10;638;392
3;;Nesmrtelný příběh             ;19951028;;67;;
4;;Smrt v císařském domě         ;199510 7;;117;;

Tento fragment navíc také obsahuje středníky místo čárek jako oddělovače, a chybný formát datumů ve sloupci TheatreId.

Správně by tedy tento fragment vypadal takto:

Id,Name,NameShort,PremiereDt,DerniereDt,TheatreId,StageId,EnsemleId
1,,Antigona,1995-11-03,,231,674,
2,,"Ten, který dostává políčky",1995-10-30,,10,638,392
3,,Nesmrtelný příběh,1995-10-28,,67,,
4,,Smrt v císařském domě,1995-10-7,,117,,
  • standardy/csv/mezery-v-hodnotách.txt
  • Poslední úprava: 2020/12/06 14:27
  • autor: Jakub Klímek