UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xff in position 0: invalid start byte

最新推荐文章于 2024-06-27 09:45:02 发布

苦学算法

最新推荐文章于 2024-06-27 09:45:02 发布

阅读量2.2k

点赞数

文章标签： pycharm python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_64380370/article/details/127594641

版权

首先讲一下utf-8和utf-16的区别：UTF-16比较好理解,就是任何字符对应的数字都用两个字节来保存。UTF-8表示可变字符,或一个字节表示一个字符,或是两个，最多不能超过3个字节了。这时候utf-8和utf-16就有各自的适用情况了，对于全是英文或者英文绝大多数的文本可以通过utf-8编码，当文本绝大多数为中文（一个汉字占两个字节），可以使用utf-16，这样又省时又省力，同时提高了可靠性。

用python读取中文text文件时，发生了UnicodeDecodeError，报错内容为:

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xff in position 0: invalid start byte

问题解决如下：

方法1：使用utf-16编码即可正常读取文件。

当读取文件出现UnicodeDecodeError基本上是文件内容的编码方式，如果不确定使用什么编码读取文件，可以使用notepad查看文件的编码格式，然后在encoding处选择文件的编码格式即可正常读取文件内容。

当改为utf-16后：

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xff in position 0: invalid start byte

在中文文本数据读取时，遇到encoding问题，在使用utf-8报错UnicodeDecodeError，可以尝试改为utf-16
复制链接

扫一扫

苦学算法 CSDN认证博客专家 CSDN认证企业博客

码龄3年

3: 原创

187万+: 周排名

30万+: 总排名

3014: 访问

: 等级

41: 积分

6: 粉丝

10: 获赞

2: 评论

10: 收藏

私信

关注

热门文章

最新评论

C++Primer2.1.1算术类型详讲
CSDN-Ada助手: 非常祝贺您写下了第三篇博客！标题中的主题“C++Primer2.1.1算术类型详讲”听起来非常有趣和深入。您对于这个主题的详细解析一定会给读者带来很多收获。在下一步的创作中，我建议您可以考虑将这个主题和其他相关的主题结合起来，进一步展开讨论。比如，您可以探索不同算术类型之间的转换规则，或者深入研究它们在实际编程中的应用场景。这样的扩展将使您的读者更全面地理解算术类型的概念和用法。请继续保持您的创作热情，并期待您未来更多有价值的文章！谦虚地说，我相信您将在C++领域做出更多有意义的贡献。 CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。