Python网络爬虫案例实战:静态网页爬取:定制请求头

Python网络爬虫案例实战:静态网页爬取:定制请求头

3.7定制请求头

请求头 Headers提供了关于请求、响应或其他发送实体的信息。对于爬虫而言,请求头十分重要,尽管在上一个例子中并没有制定请求头。如果没有指定请求头或请求的请求头与实际网页不一致,就可能无法返回正确的结果。
Requests并不会基于定制的请求头 Headers的具体情况改变自己的行为,只是在最后的请求中,所有的请求头信息都会被传递进去。
在 Requests 中可以通过r.headers获取响应头内容。例如:

>>> r.headers
{'Server': 'nginx', 'Date': 'Fri, 09 Aug 2024 11:49:26 GMT', 'Content-Type': 'text/html', 'Content-Length': '813', 'Connection': 'keep-alive'}

由结果可以看到是以字典的形式返回了全部内容,也可以访问部分内容。例如:

>>> r.headers['Content-Type']
'text/html'
>>> r.headers.get('content-type')
'text/html'

而请求头内容可以用r.request.headers来获取。例如:

>>> r.request.headers
{'User-Agent': 'python-requests/2.31.0', 'Accept-Encoding': 'gzip, deflate', 'Accept': '*/*', 'Connection': 'keep-alive'}

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值