python爬虫 编码错误 file open修改编码方式

在使用requests.get(url).text获取到文本后,将文本写入通过open(uri,'w+')打开的文件后,修改文件名后缀为html,打开后所有字符乱码,查阅资料后是因为编码问题,win中的txt默认为ANSI(选择另存为可查看),而从通过爬取网页读取的文本编码方式为utf-8,所以在打开文件的时候需要设置open打开文件的编码方式,具体命令为

file=open(uri,'r+',encoding='utf-8')

再将爬取的文件存入就不会有编码错误了



参考资料链接

python中decode和encode的区别

https://blog.csdn.net/qq_34162294/article/details/53727357

解决方法(百度知道)

https://zhidao.baidu.com/question/1823614815658365068.html












  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值