请问什么是
CSV
文件?
所谓
“CSV”
,是
Comma Separated Value
(逗号分隔值)的英文缩写,通常都是纯文本文件。
下面是一个实际
CSV
文件中的部分内容,让大家对他有一个感性的认识。我们选的是
Sjojo_Rescan
的
CSV
文件
(Sjojo
是
ASW-
亚洲扫图风的成员之一
)
。
sj_mino1001.jpg,715282,4FB55FE8,
sj_mino1002.jpg,471289,93203C5C,
sj_mino1003.jpg,451929,C4E80467,
通常
CSV
文件开头是不留空的,以行为单位,每行中记录一张图片的了多项数据,每项数
据用逗号
来分隔(标准英文逗号)
。一般说来集图用的
.CSV
文件的格式是这样的:
文件名
,
文件大小
(
以字节为单位
),CRC
校验值
,
注释
(
可省略
)
sj_mino1001.jpg,715282,4FB55FE8,
文件名
文件大小
CRC
值
注释
(
已省略
)
如果你的机器上装了
Microsoft Excel
的话,
.csv
文件默认是被
Excel
打开的。
需要注意的是,
当你
双击一个
.CSV
文件,
Excel
打开它以后即使不做任何的修改,在关闭的时候
Excel
往
往会提示是否要
改成正确的文件格式,
这个时候千万记得要选择
“
否
”
。
因为
Excel
认为
.CSV
文件中的数字是要用
科学记数法来表示的,
而我们要的
.CSV
文件中的数字是普通的。
如果
你选择了
“
是
”
的话,
Excel
会把
CSV
文件中所有的数字用科学计数来表示(
2.54932E+5
这种形式)
,这个文件就没法
用了。
所
以如果你的
CSV
文件绝大部分都是用在集图上的话,
建议把
.CSV
的默认打开方
式改成任意一个文本
编辑器,系统自带的记事本就是个不错的选择。
好,
让我们回到
CSV
文件的格式中来。
见上面,
从左到右
sj_mino1001.jpg
是文件名,
715282
是以字节表示的文件大小。当文件名中包含逗号的时候,由于逗号在
CSV
文件中特殊的作
用
,
为
了
不
至
于
产
生
歧
义
,
需
要
用
引
号
把
文
件
名
括
起
来
。
比
如
"The
Art,
Fantasy.jpg",384211,...,....
接着是一个
8
位的
16
进制数字
4FB55FE8
,
这是文件的
CRC32
校
验值。整个
CSV
文件的精髓都在这里。
让我们举个小例子来说明它的意义:
Sjojo
发布了一张图
sj_mino1001.jpg
,假设你是从朋友
手中拿
到这张图的,那么你肯定常常会有这样的疑问,这张图在传播的过程中是否被改动
过呢?是否无意
中遭到了损坏呢?
CRC
就是为解决这个问题而存在的。一般情况下,扫图
家每发布了一套图,
就同
时放出一个
CSV
文件
(这种
CSV
通常叫做
Official CSV
,
也就是
官方发布的
CSV
的意思)
,
这个
CSV
中
的
CRC
值是用专门的软件通过
CRC32
算法
(常用
的
CRC
算法还有
CRC16
)对文件运算后生成的一个值,
这个值可用作文件真身的标志。
在绝大多数情况下,如果这个文件在传播过程中无论是大小还是内
容被改动过。那么,用
同样的
CRC32
算法再对文件进行运算后产生的
CRC
校验值就完全不一样了。如
果得出的
CRC
值是一样的,
则完全有理由认为这个文件是真身,
没有被改动过。
还有些时候,
收来
的
图片文件名被改动过了,那么你怎么知道谁是谁呢?这个时候
CRC
值又起作用了:用专用
的软件对图片处理后,可以得到文件的大小和
CRC
值,然后根据大小和
CRC
值在
CSV
中
寻找是否有适合的图片。如果有,就会把图片的名字改成
CSV
里的。举个例子,你收到了
一张图片,
名字是
pic0001.jpg
,
同时你知道这张图片是
Sjojo_Rescan
这个集子里面的,
但是
不知道具体是哪一张。用软件得到它的大小和
CRC
分别是
715282
和
4FB55FE8
,那么软件
在
CSV
文件里找到一行
sj_mino1001.jpg,715282,4FB55FE8,
大小和
CRC
都符合,软件就认
为这张图片的原名是
sj_mino1001.jpg
,
接着自动把文件的名字改成
sj_mino1001.jpg
。
改动的
不是
CSV
文件而是图片的文件名。接下来的是注释和说明,可以省略掉。需要注意的是注
释的后面是没有逗号的,如果要省略注释的话,一定要在
CRC
值的后面保留一个逗号,否
则软件会把
CRC
值认为是注释的
什么是
CSV
文件
?
如何建立
CSV
文件
?
利用电子表格程序可以创建和修改
CSV
文件。
CSV
文件采用表格格式,
可以多行多列,
第
一行为标题行,标题行必须包含联系人名字,还可加入各种联系方式(如邮箱、
、
MSN
、
KC
、电话、手机)等字段;
联系人名字和其他各种联系方式各占一列,把联系人资料添加