pandas的read_csv读入文件报错'utf-8' codec can't decode byte 0xc6 in position 3: invalid continuation byte

这也许不一定要通过改变编码的方式解决,说不定是跟csv文件的一些格式有关!!!
有人说程序是玄学,确实,那么复杂的计算机,程序,偶尔出点难解的小问题,应该也是可以谅解的吧!

我是在用pandas读取movielens的影评数据集时出现问题的。一共有4个csv文件,movies,link的读取正常,tags,ratings就出现了**‘utf-8’ codec can’t decode byte 0xc6 in position 3: invalid continuation byte报错,尝试百度的方法改变了编码,添加了delimeter = ','等都无果,于是进行了如下步骤然后成功了:
1.将可以成功打开的’movies.csv’文件复制一份,会自动命名为’movies-附件.csv’,并保存在当前目录下(为什么是’movies.csv’呢?因为它能够被成功读出来嘛!当然要像成功者靠拢了)!
2.打开’movies-附件.csv’和’ratings,csv’,将’ratings.csv’的内容复制到’movies-附件.csv’。点击关闭,会出现弹窗询问是否要保存不兼容的格式,点击否,保存副本。方便起见,将副本保存在桌面(名字仍为’movies-附件.csv’)。然后,查看桌面是否已存在此文件,存在了则再次点击关闭,仍然会出现上述弹窗,点击是退出。(网页版微信没有截图功能,手机拍图的,有点low,大家意思一下随便看看就好,希望可以帮助到有同样困惑的盆友们!)
在这里插入图片描述
3.用pandas读取movies-附件.csv即可得到ratings的内容。在这里,很奇怪的一点,同样的内容,文件名改为‘movies1.csv’等等都可以读取出来,但是包含ratings就报错了。深层原因也是非常不解!(show一下读出来后的效果) 在这里插入图片描述
4.顺藤摸瓜,发现,直接把‘ratings’文件名改为‘movies3’,也是可以读出来的。也就是说,报错是因为
csv文件的文件名**,改一改说不定就能读出来了。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值