在使用requests.get(url).text获取到文本后,将文本写入通过open(uri,'w+')打开的文件后,修改文件名后缀为html,打开后所有字符乱码,查阅资料后是因为编码问题,win中的txt默认为ANSI(选择另存为可查看),而从通过爬取网页读取的文本编码方式为utf-8,所以在打开文件的时候需要设置open打开文件的编码方式,具体命令为
file=open(uri,'r+',encoding='utf-8')
再将爬取的文件存入就不会有编码错误了
python中decode和encode的区别
https://blog.csdn.net/qq_34162294/article/details/53727357
解决方法(百度知道)
https://zhidao.baidu.com/question/1823614815658365068.html