‘gbk‘ codec can‘t decode byte 0xac in position 400623: illegal multibyte sequenc解决办法

最新推荐文章于 2024-02-28 19:48:17 发布

悦小白

最新推荐文章于 2024-02-28 19:48:17 发布

阅读量6.3k

点赞数 3

分类专栏：解决运行代码时的问题文章标签：数据分析 python 中文分词全文检索

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_62837637/article/details/127656344

版权

解决运行代码时的问题专栏收录该内容

14 篇文章 0 订阅

订阅专栏

我在写代码的时候遇到了这个问题，可以推断文件是gbk无法解析的文件，我们的文本当中有中文字符（gbk表示国标）

我百度到的解决办法是将编码方式改为utf-8编码

with open('D:\文本数据分析\data\红岩.txt', 'r', encoding='utf-8') as f:

但是我的运行报错了这个问题

'utf-8' codec can't decode byte 0xa1 in position 0: invalid start byte

显然utf-8编码是不行的，改成下面这种就可以运行了

with open('D:\文本数据分析\data\红岩.txt', 'r', encoding="gb18030") as f:

现在很多读取文件默认使用utf-8来解码，但是有一些文本文件编码的时候却不一定使用的是utf-8编码，所以读取会出问题。

关注

3
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
1
评论
‘gbk‘ codec can‘t decode byte 0xac in position 400623: illegal multibyte sequenc解决办法

'gbk' codec can't decode byte 0xac in position 400623: illegal multibyte sequenc解决办法
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

悦小白 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。