python中的headers是什么意思_python爬虫实战：request如何定义headers

最新推荐文章于 2024-03-22 08:24:50 发布

eric孙

最新推荐文章于 2024-03-22 08:24:50 发布

阅读量8.7k

点赞数 1

文章标签： python中的headers是什么意思

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_30564447/article/details/113652043

版权

都说知识之间是相互汇通和包容的，借着我们之前才讲过header的热乎劲，为大家带来新朋友request的同时，也不忘记再来跟我们的老朋友header见见面。说到这里已经有小伙伴开始好奇，request会定义headers呢？简单的来说就是request帮助header进行网页访问，接下来看看是如何进行的吧。

对于写爬虫来讲，模拟浏览器是发请求的时候做的最多的事情了，最常见的模拟浏览器无非就是伪装headers：In [23]: url = 'http://xlzd.me'

In [24]: headers = {'User-Agent': 'my custom user agent', 'Cookie': 'haha'}

In [25]: requests.get(url, headers=headers)

拓展：

怎样取出HTTP response里面的内容呢？In [7]: r = requests.get('http://xlzd.me')

In [8]: r.encoding

Out[8]: 'UTF-8'

In [9]: r.headers

Out[9]: {'Content-Encoding': 'gzip', 'Transfer-Encoding': 'chunked', 'Vary': 'Accept-Encoding', 'Server': 'nginx', 'Connection': 'keep-alive', 'Date': 'Fri, 11 Dec 2015 06:42:31 GMT', 'Content-Type': 'text/html; charset=UTF-8', 'X-Pingback': 'http://xlzd.me/action/xmlrpc'}

In [10]: r.cookies

Out[10]:

In [11]: r.text

Out[11]: u'HTML>\n\n\t

requests会自动对响应内容编码，所以就可以通过r.text取出响应文本了。对于别等响应内容(文件、图片、...)，则可以通过r.content取出来。对于json内容，也可以通过r.json()来取。

本篇的借助request访问网页浏览的方法大家肯定都学会了，从代码上面看，算是最简单的一种。如果之间有其他方法没有学会的小伙伴，可以以后都使用request方法。

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。