python爬虫请求头如何设置?这篇文章讲解得超详细

这篇文章小编给大家详细介绍一下在python中爬虫请求头的方法,感兴趣的小伙伴一定要耐心阅读一下这篇文章,对于那些使用爬虫的小伙伴帮助非常大,我们废话少说直接开始分享干货!

python爬虫请求头如何设置?这篇文章讲解得超详细

小编分别通过requests设置、Selenium+Chrome设置、selenium+phantomjs设置、爬虫框架scrapy设置、Python异步Aiohttp设置来给大家详细介绍一下

(一)requests设置请求头:

import requests
 
 url="http://www.targetweb.com"
 
 headers={
 
 'Accept':'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8',
 
 'Cache-Control':'max-age=0',
 
 'Connection':'keep-alive',
 
 'Referer':'http://www.baidu.com/',
 
 'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) 
 Chrome/53.0.2785.104 Safari/537.36 Core/1.53.4882.400 QQBrowser/9.7.13059.400'}
 
 res=requests.get(url,headers=headers)
 
 #图片下载时要用到字节流,请求方式如下
 
 #res=requests.get(url,stream=True,headers)

(二)Selenium+Chrome请求头设置:

from selenium import webdriver
 options = webdriver.ChromeOptions()
 options.add_argument('lang=zh_CN.UTF-8')# 设置中文
 options.add_argument('user-agent="Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 
 (KHTML, like Gecko) Chrome/53.0.2785.104 Safari/537.36 Core/1.53.4882.400 QQBrowser/9.7.13059.400"')
 # 设置头部
 browser = webdriver.Chrome(chrome_options=options)
 url="http://www.targetweb.com"
 browser.get(url)
 browser.quit()

(三)selenium+phantomjs请求头设置:

from selenium import webdriver
 from selenium.webdriver.common.desired_capabilities import DesiredCapabilities
 des_cap = dict(DesiredCapabilities.PHANTOMJS)
 des_cap["phantomjs.page.settings.userAgent"] = ("Mozilla/5.0 (Windows NT 6.1; WOW64)
  AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.104 Safari/537.36 Core/1.53.4882.400 
  QQBrowser/9.7.13059.400")
 browser = webdriver.PhantomJS(desired_capabilities=des_cap)
 url="http://www.targetweb.com"
 browser.get(url)
 browser.quit()

(四)爬虫框架scrapy设置请求头:

在settings.py文件中添加如下:

DEFAULT_REQUEST_HEADERS = {
 'accept': 'image/webp,*/*;q=0.8',
 'accept-language': 'zh-CN,zh;q=0.8',
 'referer': 'https://www.baidu.com/',
 'user-agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) 
 Chrome/53.0.2785.104 Safari/537.36 Core/1.53.4882.400 QQBrowser/9.7.13059.400',}

(五)Python异步Aiohttp请求头设置:

import aiohttp
 url="http://www.targetweb.com"
 headers={
 'Accept':'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8',
 'Cache-Control':'max-age=0',
 'Connection':'keep-alive',
 'Referer':'http://www.baidu.com/',
 'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) 
 Chrome/53.0.2785.104 Safari/537.36 Core/1.53.4882.400 QQBrowser/9.7.13059.400'}
 asyncwithaiohttp.ClientSession(headers=headers)assession:
 asyncwithsession.get(url)asresp:
 print(resp.status)
 print(awaitresp.text())

以上就是小编给大家带来的在python爬虫请求头设置的方法,希望大家通过阅读小编的文章之后能够有所收获!如果大家觉得小编的文章不错的话,可以多多分享给有需要的人。

关于Python技术储备

学好 Python 不论是就业还是做副业赚钱都不错,但要学会 Python 还是要有一个学习规划。最后大家分享一份全套的 Python 学习资料,给那些想学习 Python 的小伙伴们一点帮助!

一、Python所有方向的学习路线

Python所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。

在这里插入图片描述

二、Python必备开发工具

三、Python视频合集

观看零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。

四、实战案例

光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。

五、Python练习题

检查学习结果。

六、面试资料

我们学习Python必然是为了找到高薪的工作,下面这些面试题是来自阿里、腾讯、字节等一线互联网大厂最新的面试资料,并且有阿里大佬给出了权威的解答,刷完这一套面试资料相信大家都能找到满意的工作。

 最后祝大家天天进步!!

上面这份完整版的Python全套学习资料已经上传至CSDN官方,朋友如果需要可以直接微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】。

  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

程序员二飞

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值