一,什么是CSV文件
CSV(Comma-Separated Values,CSV)是逗号分隔符的简称,以纯文本形式存储表格数据(可以把纯文本理解为字符串)。
CSV文件由任意数目的记录组成,记录间以某种换行符分隔;每条记录由字段组成,字段间的分隔符最常见的是逗号或制表符。
CSV文件格式的通用标准并不存在,但是在RFC 4180中有基础性的描述。使用的字符编码同样没有被指定,但是7-bit ASCII是最基本的通用编码。术语“CSV”,泛指具有以下特征的文件:
- 纯文本,使用某个字符集,比如ASCII,Unicode,EBCDIC或GB2312
- 由记录组成,典型的是每行一条记录
- 每条记录被分隔符分隔为字段(典型的分隔符有逗号、分号或制表符;有时分隔符可以包括可选的空格)
- 每条记录都有同样的字段序列。
CSV文件需遵循以下规则:
- 开头不留空,以行为单位
- 可包含或不含列名,含列名则局文件第一行
- 一行数据不跨行,不空行
- 以半角逗号作为分隔符,列为空也要表达其存在
- 列内容如存在半角引号,替换成半角双引号转义
- 文件读写时引号、逗号操作规则互逆
- 内码格式不限,可以为ASCII、Unicode或者其他
- 不支持数字
- 不支持特殊字符
CSV文件举例:
AKDT,Max TemperatureF,Mean TemperatureF,Min TemperatureF
2014-7-1,64,56,50
二,CS