python + seleinum +phantomjs 设置headers和proxy代理

最近因为工作需要使用selenium+phantomjs无头浏览器,其中遇到了一些坑,记录一下,尤其是关于phantomjs设置代理的问题。

基本使用

首先在python中导入使用的包,其中webdriver是要创建无头浏览器对象的模块,DesiredCapabilites这个类是浏览器对象的一些选项设置。

from selenium import webdriver
from selenium.webdriver.common.desired_capabilities import DesiredCapabilities

# 初始化浏览器对象
desired_cap = DesiredCapabilities.PHANTOMJS.copy()
driver = webdriver.PhantomJS(desired_capabilities=desired_cap)

修改请求头

在使用爬虫的过程中我们需要修改请求投中的user-agent防止被反爬,修改过程如下

desired_cap = DesiredCapabilities.PHANTOMJS.copy()
# 修改请求头中的UA
desired_cap['phantomjs.page.settings.userAgent'] = 'xxxxxx'
# 设置其他请求投信息,其中key为要修改的请求投键名
desired_cap['phantomjs.page.customHeaders.{}'.format(key)] = 'xxxx'
driver = webdriver.PhantomJS(desired_capabilities=desired_cap)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值