爬虫项目:用selenium模拟登陆后,用requests的Session维护一个会话爬取数据

本文介绍了如何解决使用selenium模拟登录后,因网站采用会话cookie导致关闭页面即失效的问题。通过requests的Session保持登录状态,详细讲解了分析网络请求、跟踪重定向并最终成功爬取数据的步骤。
摘要由CSDN通过智能技术生成

好久没写博客了,由于工作忙,今天也是账号有问题,解决不了问题,那就把我遇到问题总结一下,方便大家查阅。

最近遇到一个很头疼问题,就是用selenium模拟登陆账号之后,要获取数据,最让人头疼的是这个网站的cookie是会话cookie,只要你关闭页面,cookie立马失效,你什么数据都获取不到,最让人头疼的是获取了登录后的cookie但就是无法请求到数据?

遇到这个问题解决办法是就是用requests的Session()保持登录状态。

不啰嗦了,直接上解决过程
在这里插入图片描述

  1. 首先用selenium模拟登陆
import json
import re
import time
import requests
from lxml import etree
from selenium import webdriver


class IndustrialBank:

    def __init__(self):
        self.session = requests.Session()
        self.driver = webdriver.Chrome()
        self.headers = {
   
            "User-Agent": "Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.100 Safari/537.36"
        }

    def __call__(self, *args, **kwargs):
        self.login_simulation()
        # self.active_info()
        # self.credit_bill()
        # self.charge_out()

def login_simulation(self):

        login_url = 'https://personalbank.cib.com.cn/pers/main/login.do'
        self.driver.get(login_url
  • 1
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值