Selenium添加Cookie来实现自动登录

本文讲述了作者在使用selenium和Chrome爬取京东商品信息时遇到的登录问题,通过发现cookie需要更新才能继续登录,分享了如何通过获取有效cookie、构造并设置cookie来实现自动登录的过程,重点在于解决cookie过期或部分字段需要替换的问题。
摘要由CSDN通过智能技术生成

最近在写一个爬虫,需要爬取京东的商品信息。本来第一天还爬的好好的,第二天就提示要登录才能进去搜索页面了。

上网找的办法是添加cookie来实现自动登录。我写了一个程序,使用selenium+chrome,先手动登录一次之后,把Cookie保存到数据库里,然后当需要登录时,自动从数据库里面读取cookie,并设置上去。

网上的代码大都是这样,但是事实证明这是不行的,没法登陆上去。

直到我看到一篇文章之后,才意识到,可能是因为cookie里面有些内容需要被替换,才能继续使用,于是我就加了一个重新构造cookie的代码,就能实现登录了!

代码片段:

def set_cookie(browser, url):
    log.logger.info("正在设置cookie。...")
    global current_ckid
    current_ckid, cookie = utils.get_valid_cookie(url)
    # 在这里获取到了cookie
    if cookie is not None:
        browser.delete_all_cookies()
        for ck in cookie:
            # print(ck)
            cookie_dict = {
                "domain": ".jd.com",  # 火狐浏览器不用填写,谷歌要需要
                'name': ck.get('name'),
                'value': ck.get('value'),
                "expires": "",
                'path': '/',
                'httpOnly': False,
                'HostOnly': False,
                'Secure': False}
            browser.add_cookie(cookie_dict)
        # browser.refresh()
        time.sleep(3)
    else:
        log.logger.warning("无可用cookie, 停止抓取...")

转载请注明来源:Selenium添加Cookie来实现自动登录 | 龙进的博客

 

  • 0
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
1. 获取cookie 首先,我们需要使用Selenium启动浏览器,并打开我们要自动登录的网站。 ```python from selenium import webdriver # 启动浏览器 driver = webdriver.Chrome() # 打开网站 driver.get('https://www.example.com/') ``` 然后,我们可以使用`driver.get_cookies()`方法获取当前页面的所有cookie。 ```python # 获取所有cookie cookies = driver.get_cookies() # 输出所有cookie for cookie in cookies: print(cookie) ``` 输出的结果类似于: ``` {'domain': 'www.example.com', 'expiry': 1641947537, 'httpOnly': False, 'name': 'SESSIONID', 'path': '/', 'secure': False, 'value': '1234567890'} {'domain': 'www.example.com', 'expiry': 1641947537, 'httpOnly': False, 'name': 'username', 'path': '/', 'secure': False, 'value': 'testuser'} {'domain': 'www.example.com', 'expiry': 1641947537, 'httpOnly': False, 'name': 'password', 'path': '/', 'secure': False, 'value': 'testpassword'} ``` 其中,每个cookie都是一个字典,包含以下键值对: - `domain`:cookie所属的域名。 - `expiry`:cookie的过期时间(以Unix时间戳表示)。 - `httpOnly`:指示浏览器是否只能通过HTTP或HTTPS协议访问cookie。 - `name`:cookie的名称。 - `path`:cookie的路径。 - `secure`:指示浏览器是否只能通过HTTPS协议访问cookie。 - `value`:cookie的值。 2. 使用cookie完成自动登录 获取到cookie后,我们可以使用`driver.add_cookie()`方法将cookie添加到浏览器中。然后,我们可以重新打开网站,浏览器会自动使用我们添加cookie进行登录。 ```python # 添加cookie driver.add_cookie({'name': 'SESSIONID', 'value': '1234567890'}) driver.add_cookie({'name': 'username', 'value': 'testuser'}) driver.add_cookie({'name': 'password', 'value': 'testpassword'}) # 重新打开网站 driver.get('https://www.example.com/') ``` 这样,我们就完成了自动登录功能。 完整代码如下: ```python from selenium import webdriver # 启动浏览器 driver = webdriver.Chrome() # 打开网站 driver.get('https://www.example.com/') # 获取所有cookie cookies = driver.get_cookies() # 输出所有cookie for cookie in cookies: print(cookie) # 添加cookie driver.add_cookie({'name': 'SESSIONID', 'value': '1234567890'}) driver.add_cookie({'name': 'username', 'value': 'testuser'}) driver.add_cookie({'name': 'password', 'value': 'testpassword'}) # 重新打开网站 driver.get('https://www.example.com/') ``` 注意事项: - 获取和使用cookie的代码必须在同一个浏览器实例中执行。 - 添加cookie时,必须指定cookie的名称和值。其他键值对是可选的,但建议尽量指定。 - 如果添加cookie与网站当前存在的cookie冲突,可能会导致自动登录失败。此时,可以尝试清除浏览器缓存或使用不同的浏览器实例。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值