在爬取网页的过程中遇到爬取到的网页数据是乱码的情况,打印编码格式,发现网页编码格式和python编码格式不一样
res = requests.get("https://m.tupianzj.com/meinv/mm/meinvxiezhen",headers=headers)
res.encoding = "gb2312"
print(res.encoding)
print(text)
然后把编码格式转换一下就可以正常显示啦
res = requests.get("https://m.tupianzj.com/meinv/mm/meinvxiezhen",headers=headers)
res.encoding = "gb2312"