python读取不同文件的编码问题

最新推荐文章于 2022-09-21 11:38:14 发布

nlite827109223

最新推荐文章于 2022-09-21 11:38:14 发布

阅读量434

点赞数

分类专栏： python

本文链接：https://blog.csdn.net/nlite827109223/article/details/54583354

版权

python 专栏收录该内容

39 篇文章 1 订阅

订阅专栏

两个文件，一个utf-8，一个gb2312

读取gb2312时，直接读取，‘r’模式就可以，没有遇到问题，读取utf-8时，报错gbk不能对某某字符进行编码

改为'rb'模式，再用decode进行解码一下，就可以正常了

1.stopwords = []
2.f = open("D:\\task\\Chinese-master\\stopwords.txt",'rb')
3.for line in f:
3.    lines = line.decode("utf-8").strip('\n')
4.    stopwords.append(lines)

补充：python版本是3.5

优惠劵

nlite827109223

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
python读取不同文件的编码问题

两个文件，一个utf-8，一个gb2312 读取gb2312时，直接读取，‘r’模式就可以，没有遇到问题，读取utf-8时，报错gbk不能对某某字符进行编码改为'rb'模式，再用decode进行解码一下，就可以正常了1.stopwords = []2.f = open("D:\\task\\Chinese-master\\stopwords.txt",'rb')3.fo
复制链接

扫一扫