UnicodeDecodeError- 'utf-8' codec can't decode byte 0xc4 in position 0- invalid continuation byte的解决


 在用pandas读入csv文档是,因为文档中有中文所以会出现读取不了的错误。错误的原因是'utf-8'编解码器无法解码0位的字节0xc4

9c1af17bccfc95330da1d040aa11c6a.png-15.6kB

解决方案:

在读入文件后面加encoding=’gbk’,
如:pddata=pd.read_csv('felipus.csv',encoding='gbk')


有兴趣的继续看原因!

 众所周知,我们用python默认的是utf-8编码。关于编码方式的介绍,我推荐看一下廖大的python教程——“字符串和编码”。既然utf-8格式不能正确的读取带中文的csv文件,那么我们就选取一个可以读取中文字符的格式不就好了吗。

 那么什么格式可以读取中文字符呢?我们打开Python3官方网站: 找到关于标准字符的部分。如下图:

image_1c2c40hfhniuop7nln7im1rbh13.png-83.1kB

 那么到底要改成什么格式呢?可以看到表格第三列Language表示的是此种编码支持什么语言。那么我们找找看。

image_1c2c48jlei281li6143317fbh5j1t.png-52.5kB!

表格就不在这里展示给大家看了,有兴趣的自己去网站上看吧。反正在我仔细的寻找下一共有big5;big5hkscs;gb2312;gbk;gb18030;hz;iso2022_jp_2这5种格式可能支持中文。经过我的测试,发现gb2312;gbk;gb18030这3种格式可以顺利的读取带中文的csv文件。(既然3种都可以,那么我们就记个好记的’gbk’吧)

image_1c2c4ramh15an235ojsesm1vvp3q.png-17.9kB

  It works!

  • 34
    点赞
  • 38
    收藏
    觉得还不错? 一键收藏
  • 6
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值