「Python数据分析」CSV读取与写入的常见问题(空行、BOM、r/w/a模式、指针)

import csv

1. 多余的空行

原因

python正常写入文件的时候,每行的结束默认添加’\n’,即0x0D,而writerow命令的结束会再增加一个0x0D0A,因此对于windows系统来说,就是两行。采用’ b’参数,用二进制进行文件写入,系统默认是不添加0x0D的(故python2.x中的解决方式是使用“wb模式打开文件”,该方法python3.x中已不适用,会报错如下)。

TypeError: a bytes-like object is required, not 'str'

解决方法

打开待写入文件时添加newline=“”。例如。

with open(filename,"w",encoding="utf-8",newline="") as csvfile:
        writer = csv.writer(csvfile)
        writer.writerows(csv_list)

writerow()和writerows()区别


2. BOM对读写的影响

(1)什么是BOM

BOM(byte-order mark,字节顺序标记):
Unix系统中都是使用的utf-8编码,所以在Mac用open打开utf-8编码的csv文件并不用加encoding=“utf-8”。

with open(filename) as csvfile:
        reader = csv.reader(csvfile)
        content = [row for row in reader]

Windows系统的中文环境很多软件默认字符编码为gbk,比如如果用上面的语句打开csv文件则会报错。

'gbk' codec can't decode byte

这种情况可以指定编码为“gbk”来读取:

with open(filename
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值