解决error：UnicodeDecodeError: 'utf-8' codec can't decode byte 0xa1 in position 0

最新推荐文章于 2024-06-21 10:51:21 发布

haley_liyi

最新推荐文章于 2024-06-21 10:51:21 发布

阅读量4.3w

点赞数 19

分类专栏： python

本文链接：https://blog.csdn.net/angela_0612/article/details/80405179

版权

3 篇文章 0 订阅

订阅专栏

参考：

https://www.cnblogs.com/Alier/p/6794719.html

代码：

stopwords = pd.read_csv("stopwords.txt",index_col=False,quoting=3,sep=" ",names=['stopword'],encoding='UTF-8')

报错：

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xa1 in position 0

Python 编码中编码解码的问题，我这个错误就是‘utf-8’不能解码位置0的那个字节（0xa1），也就是这个字节超出了utf-8的表示范围了

解决办法：

stopwords = pd.read_csv("stopwords.txt",index_col=False,quoting=3,sep=" ",names=['stopword'],encoding='gb18030')

也就是在读取数据的时候，显式添加编码方式encoding='gb18030'，别的编码也可以试试哟

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注