解决办法
import requests
url='https://www.baidu.com/s?wd=ip'
headers={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/85.0.4183.83 Safari/537.36'}
page_text=requests.get(url=url,headers=headers).text
with open('ip.html','w',encoding='utf-8') as fp:
fp.write(page_text)
但是生成的ip.html却产生了乱码
讲enconding中改成如下
with open('ip.html','w',encoding='UTF-8') as fp:
fp.write(page_text)
讲utf-8变成UTF-8
解决网页抓取乱码问题
本文介绍了一种常见的网页抓取过程中遇到的字符编码问题及解决方案。通过使用Python的requests库获取网页内容,并调整文件写入时的编码格式从utf-8到UTF-8,成功解决了生成文件出现乱码的问题。
31万+

被折叠的 条评论
为什么被折叠?



