python request爬虫中文乱码解决方法

最新推荐文章于 2024-01-25 11:56:25 发布

zhiSiBuYu0517

最新推荐文章于 2024-01-25 11:56:25 发布

阅读量1k

点赞数

分类专栏： python 文章标签： python 爬虫开发语言

本文链接：https://blog.csdn.net/weixin_46704937/article/details/126971940

版权

python 专栏收录该内容

8 篇文章 0 订阅

订阅专栏

1.首先判断网页是utf-8编码还是gbk编码
2.然后在加入r.encoding=‘编码类型’
示例：

# -*- coding: utf-8 -*-
'''
爬虫中文乱码解决方法
author:zhangsir
'''
#网址
url = 'https://www.baidu.com'
#请求头
headers={
	"Host": "www.baidu.com",
	"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/105.0.0.0 Safari/537.36",
	"Cookie": "BIDUPSID=C7465C07C18C65C97A99CA9252B157C5; PSTM=1663725617; BAIDUID=C7465C07C18C65C93CEFB95934D4AD90:FG=1; BD_HOME=1; H_PS_PSSID=36558_36462_36921_37300_36885_37345_36569_37405_37261_26350_37285_22157_37231; BD_UPN=1a314753; BAIDUID_BFESS=C7465C07C18C65C93CEFB95934D4AD90:FG=1; BA_HECTOR=84al0lal2184a4ah810lo25o1hiks0j19; ZFY=2znAwD2OEqUOkcGnGOgJBJQB89SW7H2KCibOnac:ALc4:C"
}
#爬虫
a = requests.get(url=url,headers=headers)
#声明编码类型
a.encoding='utf-8'
#获取源码
b = a.text
#打印
print(b)