第十二章避开采集的陷阱 使用selenium库处理cookie

#!/usr/bin/env python
# _*_ coding:utf-8 _*_
#根据cookie访问网站
#思路:第一个webdriver获取网站和cookie,然后第二个web网站加载同一个网站(必须先加载,这样selenium才知道cookie属于哪个网站)
#删除所有的cookie,替换成第一个的cookie,当再次加载页面的额时候应该两组的cookie时间戳、源代码、和其他信息应该完全一致
from selenium import webdriver

driver=webdriver.phantomjs(executable_path='D:/pycharm/phantomjs-2.1.1-windows/bin/phantomjs')
driver.get("http://pythonscraping.com")
driver.implicitly_wait(1)
print(driver.get_cookies())

saveCookies=driver.get_cookies()

driver2=webdriver.phantomjs(executable_path='D:/pycharm/phantomjs-2.1.1-windows/bin/phantomjs')
driver2.get("http://pythonscraping.com")
driver2.delete_all_cookies()
for cookie in saveCookies:
    driver2.add_cookie(cookie)

driver2.get("http://pythonscraping.com")
driver2.implicitly_wait(1)
print(driver2.get_cookies())

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值