彻底解决UnicodeDecodeError: ‘xxx‘ codec can‘t decode byte 0xbf in position 2: illegal multibyte seque

要把文件读入就要解码,出现该种错误就是解码发生错误,'XXX’可以是任何种的解码方式,可以是UTF-8,可以是gbk,可以是encoding = ‘gb2312’。而解决该问题的办法有两种。
1)改变你解码的方式。如果报错‘utf-8’可以尝试‘gbk’或者‘gb2312’这些都是解码方式`

df_csv = pd.read_csv(path,header=0,encoding = 'gb2312')
df_csv = pd.read_csv(path,header=0,encoding = 'utf-8')
df_csv = pd.read_csv(path,header=0,encoding = 'gbk')

2)改变原文件的编码方式。这个都很好理解,原文件编码,你python读的时候解码,要么读的解码方式和我编码一样,要么你解码方式是啥我编码就换成你能解的,相当于一个萝卜一个坑,对症下药,你咋编的我就咋解,或者你咋解我就咋编。
以前我都是用办法一,但是有一种情况就是你必须得改。如下我要批量读入
请添加图片描述
但是1号文件的编码方式和2号文件编码方式不同,而且2-17都是相同的编码方式而1是单独的一种,总不可能用两个不同编码方式读进来吧,所以说改变1的编码方式即可。步骤如下:
(1)用记事本打开
(2)点文件-另存为-修改编码方式。
请添加图片描述

   看看其他文件都是什么编码方式,此处2-17都是utf-8,而1是ANIS,所以修改为utf-8问题解决!
  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值