selenium 获取登录cookies,并添加cookies自动登录

create-time : 2018-12-18 12:05:30

selenium 获取登录cookies,并使用之


在使用selenium 爬取淘宝商品信息的时候,发现需要登录才能查看相关商品信息。我们可以使用cookies来自动登录。

selenium 获取登录cookies

selenium 获取cookies

进入登录页面,登录。淘宝登录后会自动跳转到https://www.taobao.com
selenium 获取当前页面的URL,若为https://www.taobao.com 则证明登录成功

webdriver.Chrome().get_cookies() 获取的cookies 是列表类型<class 'list'>,是由字典组成的list.字典中包含 domain,name,value等信息。主要需要的是每一个cookies 内的name,value 项,其他项相同。

# https://www.baidu.com 中一个cookies内容,list 中的一个dict
{'domain': '.baidu.com', 'httpOnly': False, 'name': 'H_PS_PSSID', 'path': '/', 'secure': False, 'value': '123456_123456'}

为了一次登录获取cookies,可以使用多次。利用 pickle 存储相关的cookies信息,下次可以直接调用。

pickle 是Python特有的序列化工具,能够快速高效存储Python数据类型,反序列化读取后返回的仍是原先的python数据类型。而.txt 等都是字符串类型,需要转换。

  • 小技巧: pycharm 可以自动导入包,自动导入包快捷键为 Alt + Enter
import os
import pickle
import time

from selenium import webdriver
from selenium.webdriver.support.wait import WebDriverWait

brower = webdriver.Chrome()
wait = WebDriverWait(brower, 10)

def getTaobaoCookies():
    # get login taobao cookies
    url = "https://www.taobao.com/"
    brower.get("https://login.taobao.com/member/login.jhtml")
    while True:
        print("Please login in taobao.com!")
        time.sleep(3)
        # if login in successfully, url  jump to www.taobao.com
        while brower.current_url ==  url:
            tbCookies  = brower.get_cookies()
            brower.quit()
            cookies = {}
            for item in tbCookies:
                cookies[item['name']] = item['value']
            outputPath = open('taobaoCookies.pickle','wb')
            pickle.dump(cookies,outputPath)
            outputPath.close()
            return cookies

读取cookies 信息

def readTaobaoCookies():
    # if hava cookies file ,use it 
    # if not , getTaobaoCookies()
    if os.path.exists('taobaoCookies.pickle'):
        readPath = open('taobaoCookies.pickle','rb')
        tbCookies = pickle.load(readPath)
    else:
        tbCookies = getTaobaoCookies()
    return tbCookies

selenium 使用 cookies

selenium 需要先打开一个网址,才能加载进去cookies(知道cookies是哪个网站的)。添加完cookies再打开网址,使用cookies

前面读取的cookies 是一个包含着每一个cookies的name,value 的字典,即name1:value1,name2:value2字典。遍历添加网站使用的每一个cookies的name,value.

tbCookies = readTaobaoCookies()

brower.get("https://www.taobao.com")
for cookie in tbCookies:
    brower.add_cookie({
        "domain":".taobao.com",
        "name":cookie,
        "value":tbCookies[cookie],
        "path":'/',
        "expires":None
    })
brower.get("https://www.taobao.com")
  • 50
    点赞
  • 235
    收藏
    觉得还不错? 一键收藏
  • 21
    评论
使用Selenium可以非常方便地获取网站的cookies,从而实现跳过登录的效果。以下是一个简单的示例代码: ```python from selenium import webdriver # 启动浏览器 driver = webdriver.Chrome() # 访问网站并登录 driver.get("http://example.com/login") username_input = driver.find_element_by_name("username") password_input = driver.find_element_by_name("password") submit_button = driver.find_element_by_css_selector("button[type='submit']") username_input.send_keys("your_username") password_input.send_keys("your_password") submit_button.click() # 获取cookies cookies = driver.get_cookies() # 关闭浏览器 driver.quit() # 使用cookies访问需要登录的页面 new_driver = webdriver.Chrome() new_driver.get("http://example.com/protected_page") for cookie in cookies: new_driver.add_cookie(cookie) new_driver.get("http://example.com/protected_page") ``` 这个示例代码中,我们首先启动了一个Chrome浏览器,并访问了一个需要登录的网站。然后,我们使用`find_element_by_*`系列方法找到了登录表单的输入框和提交按钮,并填入了用户名和密码,最后点击了提交按钮。接着,我们使用`get_cookies()`方法获取登录后的cookies。最后,我们关闭了第一个浏览器,并启动了一个新的浏览器。在新的浏览器中,我们使用`add_cookie()`方法将之前获取到的cookies添加到了浏览器中,然后访问了需要登录才能访问的另一个页面,这样就实现了跳过登录的效果。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 21
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值