什么是session
session :通过在服务端记录的信息确定⽤户身份
这⾥这个session就是⼀个指 的是会话
会话对象是一种高级的用法,可以跨请求保持某些参数,比如在同一个Session实例之间保存Cookie,像浏览器一样,我们并不需要每次请求Cookie,Session会自动在后续的请求中添加获取的Cookie,这种处理方式在同一站点连续请求中特别方便
深入理解
所谓的会话,你可以理解成我们用浏览器上网,到关闭浏览器的这一过程。session是会话过程中,服务器用来记录特定用户会话的信息。
比如今天双11,你淘宝网浏览了哪些商品,购物车里放了多少件物品,这些记录都会被保存在session中。

实例分析
以爬虫重灾区12306来演示下吧
分析网页,获取验证码
首先分析网页
我们在登陆页面输入正确的账号,错误的密码(为了页面不被关闭),正确的验证码后在Network抓包工具中找


找出了如上图所示,这里写着 ‘生成验证码成功’
那么这个链接会有什么呢


一堆我们看不懂的数据,但是
这个链接有些地方有点怪怪的,image64中的64是什么意思呢,去掉它可不可以呢?

去掉以后,我们发现成功获取到了验证码图片,如上图
分析网页,成功验证
获取验证码图片成功了,但是如何去成功验证呢?
如图,我们又找到了成功验证的抓包信息

我们分析下参数:

本文详细讲解了Python中的session,包括其概念、会话的理解,以及通过实例分析12306验证码的获取和验证过程。通过网络抓包,解析出验证码图片链接,并利用session保持会话状态,实现验证码的正确识别。同时,探讨了session与cookie的关系,强调了两者在爬虫中的配合使用。
最低0.47元/天 解锁文章
1412

被折叠的 条评论
为什么被折叠?



