一、有时候request会出现请求的网页内容中中文部分显示为乱码
1.通过添加encoding,可以改回来
def download_page(url):
headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:61.0) Gecko/20100101 Firefox/61.0"}
r = requests.get(url, headers=headers)
r.encoding = 'gb2312'
return r.text
2.利用apparent_encoding
res = requests.get(url, headers = header)
res.encoding = res.apparent_encoding
pritn(res.text)
二、关于encoding的选择
1.查看该网页的网页源代码
charset的编码就是encoding的值