csv文件标准

一、CSV概述

按照RFC 4180标准定义:csv(The comma separated values format )为逗号分割值格式,csv文件的每一行都是一条数据记录,每条记录由一个或多个字段组成,字段间用逗号分隔,字段内容可以是字符串或者数字;它以纯文本形式存储电子表格数据,用来给各种电子表格软件交换数据或者转换数据。

csv文件不限制行数和列数,字段内容类型和大小也都没有限制,是保存大数据最通用的文件格式。科学计算、人口统计、商业信息中经常有几个G、几十G、几百G的CSV大文件进行导出存储或传输。大部分软件(包括文本编辑软件、文档编辑软件、数据分析软件、数据库软件)都支持CSV文件格式。

二、CSV格式标准定义

依据RFC 4180标准定义,CSV文件格式有以下七条规定:

1、每个记录位于单独的一行上,每一行用回车换行符进行分割(\r\n)。

2、文件最后一行的最后一个记录后面可以有回车换行符,也可以没有。

3、第一行可以存在一个可选的标题行,格式和普通记录行的一样,标题行每个字段记录此列对应的名称,应该和记录字段数量一致。(在MIME类型中,标题头行的存在与否可以通过MIME type中的”header”参数进行标记)。

4、在标题头行和普通行每行记录中,会存在一个或多个由逗号(,)分隔的字段。整个文件中每行应包含相同数量的字段,空白符也是字段的一部分,不应被忽略。每一行记录最后一个字段后不能跟逗号。

5、每个字段可用也可不用双引号(")括起来。如果字段没有用引号括起来,那么该字段内部不能出现双引号字符。

6、字段中如果包含回车换行符、双引号或者逗号,该字段需要用双引号括起来。

7、如果字段用双引号包括,那么出现在字段内的双引号前必须加一个双引号进行转义。

三、CSV样例

1、普通CSV格式

序号,姓名,性别,年龄,住址,电话号码,备注
1,李生,男,32,广州天河3号,15826541987,无
2,田舍,男,21,,15826587687,无
3,杨莉,女,18,,,无

2、字段带双引号的CSV格式

"序号","姓名","性别","年龄","住址","电话号码","备注"
"1","李生","男","32","广州天河3号","15826541987","无"
"2","田舍","男","21","","15826587687","无"
"3","杨莉","女","18","","","无"

3、字段带回车换行符、双引号或者逗号特殊字符的CSV格式

序号,姓名,性别,年龄,住址,电话号码,行为
1,李生,男,32,广州天河3号,15826541987,"可以喊""老李"""
2,田舍,男,21,,15826587687,"他的名字叫:
田舍"
3,杨莉,女,18,,,"不允许深夜外出,不允许到酒吧,也不能染头发"

四、CSV文件编辑软件

1、snapde软件,能够打开编辑超过100万行的csv文件,具有冻结、过滤、排序、删除重复、公式等一系列基础数据处理功能

下载地址:http://www.snapman.xyz

2、excel软件,能够打开编辑1048576 行CSV数据

3、wps软件,能够打开编辑1048576 行CSV数据

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值