python爬虫请求头如何设置？这篇文章讲解得超详细

程序员二飞

已于 2024-01-05 18:42:32 修改

阅读量2.5k

点赞数 1

文章标签： python 爬虫开发语言

于 2023-09-18 13:44:07 首次发布

本文链接：https://blog.csdn.net/xiangxueerfei/article/details/132975477

版权

这篇文章小编给大家详细介绍一下在python中爬虫请求头的方法，感兴趣的小伙伴一定要耐心阅读一下这篇文章，对于那些使用爬虫的小伙伴帮助非常大，我们废话少说直接开始分享干货！

python爬虫请求头如何设置？这篇文章讲解得超详细

小编分别通过requests设置、Selenium+Chrome设置、selenium+phantomjs设置、爬虫框架scrapy设置、Python异步Aiohttp设置来给大家详细介绍一下

（一）requests设置请求头:

import requests
 
 url="http://www.targetweb.com"
 
 headers={
 
 'Accept':'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8',
 
 'Cache-Control':'max-age=0',
 
 'Connection':'keep-alive',
 
 'Referer':'http://www.baidu.com/',
 
 'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) 
 Chrome/53.0.2785.104 Safari/537.36 Core/1.53.4882.400 QQBrowser/9.7.13059.400'}
 
 res=requests.get(url,headers=headers)
 
 #图片下载时要用到字节流，请求方式如下
 
 #res=requests.get(url,stream=True,headers)

（二）Selenium+Chrome请求头设置:

from selenium import webdriver
 options = webdriver.ChromeOptions()
 options.add_argument('lang=zh_CN.UTF-8')# 设置中文
 options.add_argument('user-agent="Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 
 (KHTML, like Gecko) Chrome/53.0.2785.104 Safari/537.36 Core/1.53.4882.400 QQBrowser/9.7.13059.400"')
 # 设置头部
 browser = webdriver.Chrome(chrome_options=options)
 url="http://www.targetweb.com"
 browser.get(url)
 browser.quit()

（三）selenium+phantomjs请求头设置：

from selenium import webdriver
 from selenium.webdriver.common.desired_capabilities import DesiredCapabilities
 des_cap = dict(DesiredCapabilities.PHANTOMJS)
 des_cap["phantomjs.page.settings.userAgent"] = ("Mozilla/5.0 (Windows NT 6.1; WOW64)
  AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.104 Safari/537.36 Core/1.53.4882.400 
  QQBrowser/9.7.13059.400")
 browser = webdriver.PhantomJS(desired_capabilities=des_cap)
 url="http://www.targetweb.com"
 browser.get(url)
 browser.quit()

（四）爬虫框架scrapy设置请求头：

在settings.py文件中添加如下：

DEFAULT_REQUEST_HEADERS = {
 'accept': 'image/webp,*/*;q=0.8',
 'accept-language': 'zh-CN,zh;q=0.8',
 'referer': 'https://www.baidu.com/',
 'user-agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) 
 Chrome/53.0.2785.104 Safari/537.36 Core/1.53.4882.400 QQBrowser/9.7.13059.400',}

（五）Python异步Aiohttp请求头设置:

import aiohttp
 url="http://www.targetweb.com"
 headers={
 'Accept':'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8',
 'Cache-Control':'max-age=0',
 'Connection':'keep-alive',
 'Referer':'http://www.baidu.com/',
 'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) 
 Chrome/53.0.2785.104 Safari/537.36 Core/1.53.4882.400 QQBrowser/9.7.13059.400'}
 asyncwithaiohttp.ClientSession(headers=headers)assession:
 asyncwithsession.get(url)asresp:
 print(resp.status)
 print(awaitresp.text())

以上就是小编给大家带来的在python爬虫请求头设置的方法，希望大家通过阅读小编的文章之后能够有所收获！如果大家觉得小编的文章不错的话，可以多多分享给有需要的人。

关于Python技术储备

学好 Python 不论是就业还是做副业赚钱都不错，但要学会 Python 还是要有一个学习规划。最后大家分享一份全套的 Python 学习资料，给那些想学习 Python 的小伙伴们一点帮助！

一、Python所有方向的学习路线

Python所有方向的技术点做的整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照上面的知识点去找对应的学习资源，保证自己学得较为全面。

在这里插入图片描述

二、Python必备开发工具

三、Python视频合集

观看零基础学习视频，看视频学习是最快捷也是最有效果的方式，跟着视频中老师的思路，从基础到深入，还是很容易入门的。

四、实战案例

光学理论是没用的，要学会跟着一起敲，要动手实操，才能将自己的所学运用到实际当中去，这时候可以搞点实战案例来学习。

五、Python练习题

检查学习结果。

六、面试资料

我们学习Python必然是为了找到高薪的工作，下面这些面试题是来自阿里、腾讯、字节等一线互联网大厂最新的面试资料，并且有阿里大佬给出了权威的解答，刷完这一套面试资料相信大家都能找到满意的工作。

最后祝大家天天进步！！

上面这份完整版的Python全套学习资料已经上传至CSDN官方，朋友如果需要可以直接微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】。

程序员二飞

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
打赏
0
评论
python爬虫请求头如何设置？这篇文章讲解得超详细

这篇文章小编给大家详细介绍一下在python中爬虫请求头的方法，感兴趣的小伙伴一定要耐心阅读一下这篇文章，对于那些使用爬虫的小伙伴帮助非常大，我们废话少说直接开始分享干货！
复制链接

扫一扫