selenium.Chrome传递cookies给requests

解决痛点:selenium的模拟浏览器功能虽然强大,但是慢,而且多开容易崩溃。所以用模拟登陆取得cookie,然后传递给requests。requests带cookies访问站点受限较少。

以拉勾网为例

找到用户名密码输入框,点击登录

from selenium import webdriver
import requests

bw= webdriver.Chrome('D:\\安装文件\\chromedriver.exe')  
bw.get('https://passport.lagou.com/login/login.html?ts=1523322806071&serviceId=lagou&service=https%253A%252F%252Fwww.lagou.com%252F&action=login&signature=6B8D1DC4C3FFCDD66E6A9B43CD049F69')
bw.find_element_by_xpath("//form[@class='active']/div[@class='input_item clearfix']/input[@type='text']").send_keys('13524576770')
bw.find_element_by_xpath("//form[@class='active']/div[@class='input_item clearfix']/input[@type='password']").send_keys('******342')
bw.find_element_by_xpath("//form[@class='active']/div[@class='input_item btn_group clearfix']/input[@type='submit']").click()  #

time.sleep(3)

注意:

1、chrome的浏览器和驱动chromedriver.exe的版本要对应,不然报错,也可以用Phanomjs

2、模拟点击登录以后要等待一下,click之后,网页并不会等待cookies传入完整再执行下一行,所以要time.sleep(3)等待一下

cookies={}
for cookie in bw.get_cookies():
    cookies[cookie['name']]=cookie['value']
把cookies列表中的每一个dict取出来,取得其中的name和value,变成requests可以接受的格式
h={'user-agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Safari/537.36'}
r=requests.get('https://www.lagou.com/',headers=h,cookies=cookies)
print('我的简历' in r.text)

True


后面可以不定期更新一下bw,重新获取一下cookies,以防止cookies过期


欢迎批评指正


  • 0
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值