python爬虫之session实例精讲

本文详细讲解了Python中的session,包括其概念、会话的理解,以及通过实例分析12306验证码的获取和验证过程。通过网络抓包,解析出验证码图片链接,并利用session保持会话状态,实现验证码的正确识别。同时,探讨了session与cookie的关系,强调了两者在爬虫中的配合使用。
摘要由CSDN通过智能技术生成

什么是session

session :通过在服务端记录的信息确定⽤户身份

这⾥这个session就是⼀个指 的是会话

会话对象是一种高级的用法,可以跨请求保持某些参数,比如在同一个Session实例之间保存Cookie,像浏览器一样,我们并不需要每次请求Cookie,Session会自动在后续的请求中添加获取的Cookie,这种处理方式在同一站点连续请求中特别方便

深入理解

所谓的会话,你可以理解成我们用浏览器上网,到关闭浏览器的这一过程。session是会话过程中,服务器用来记录特定用户会话的信息。

比如今天双11,你淘宝网浏览了哪些商品,购物车里放了多少件物品,这些记录都会被保存在session中。
在这里插入图片描述

实例分析

以爬虫重灾区12306来演示下吧

分析网页,获取验证码

首先分析网页

我们在登陆页面输入正确的账号,错误的密码(为了页面不被关闭),正确的验证码后在Network抓包工具中找
在这里插入图片描述
在这里插入图片描述
找出了如上图所示,这里写着 ‘生成验证码成功’

那么这个链接会有什么呢
在这里插入图片描述
在这里插入图片描述
一堆我们看不懂的数据,但是

https://kyfw.12306.cn/passport/captcha/captcha-image64?login_site=E&module=login&rand=sjrand&1597942198585&callback=jQuery19109934921108818662_1597942150626&_=1597942150627

这个链接有些地方有点怪怪的,image64中的64是什么意思呢,去掉它可不可以呢?

在这里插入图片描述
去掉以后,我们发现成功获取到了验证码图片,如上图

分析网页,成功验证

获取验证码图片成功了,但是如何去成功验证呢?

如图,我们又找到了成功验证的抓包信息
在这里插入图片描述
我们分析下参数:

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值