爬虫scrapy+selenium带cookie免密码登录状态

本文介绍了如何在Scrapy爬虫中利用Selenium进行网页登录,并将登录后的Cookie应用于爬虫会话,确保在同一个会话中进行爬取,避免了因不同会话导致的登录状态丢失问题。
摘要由CSDN通过智能技术生成

1.如果你的爬虫使用webdriver来作为访问页面,用什么scrapy自带的post form表单来登陆是不行的。因为你的session不是同一个会话,所以你必须在webdriver来进行添加cookie的方法

方法1:
 

# 设置无头模式 浏览器就不会弹出来
        opts = FirefoxOptions()
        opts.add_argument("--headless")
        firefox_options = opts
        driver = wb.Firefox(firefox_options = opts)
        driver.implicitly_wait(3)
        # print "11111111111111111111111"
        click_url = "xxx.com/click"
        driver.get(request.url)
        if request.url != click_url and request.url != "xxx.com/login":
            # print 22222222222222
            page = driver.page_source
            driver.close()
            return HtmlResponse(request.url, body=page, encoding='utf-8', request=request, )

        used_selenium = request.meta.get('usedSelenium', False)
        if used_selenium:

            click_a = '//a[@class=
  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值