python爬虫编码错误 file open修改编码方式

最新推荐文章于 2023-12-07 13:49:35 发布

向前走呀不回头

最新推荐文章于 2023-12-07 13:49:35 发布

阅读量929

点赞数

分类专栏： python 文章标签： python open 编码错误 file

本文链接：https://blog.csdn.net/cy776719526/article/details/80076224

版权

python 专栏收录该内容

6 篇文章 1 订阅

订阅专栏

在使用requests.get(url).text获取到文本后，将文本写入通过open（uri,'w+'）打开的文件后，修改文件名后缀为html，打开后所有字符乱码，查阅资料后是因为编码问题，win中的txt默认为ANSI（选择另存为可查看），而从通过爬取网页读取的文本编码方式为utf-8，所以在打开文件的时候需要设置open打开文件的编码方式，具体命令为

file=open(uri,'r+',encoding='utf-8')

再将爬取的文件存入就不会有编码错误了