爬虫网络模块的补充
cookie
cookie:通过在客户端的记录的信息确定用户身份
作用
1反爬 12306
·为什么在网页中有数据而在网页的源码中没有
·关键该如何找出来(你想要的数据)
2.模拟登录
session 通过在服务端记录的信息来确定用户的身份 保持会话
需求:突破12306的图片验证码(result_message: “验证码校验成功” result_code: “4”
https://kyfw.12306.cn/passport/captcha/captcha-check?
1.账号正确 密码错误 验证码错误
2.账号正确 密码错误 验证码正确
3.账号正确 密码正确 验证码正确
找到验证码的图片 然后进行处理
https://kyfw.12306.cn/passport/captcha/captcha-image64?login_site=E&module=login&rand=sjrand&1614755337677&callback=jQuery19109290651273500419_1614755333546&_=1614755333547
反复查找 一下以图片验证码的地址
https://kyfw.12306.cn/passport/captcha/captcha-image?login_site=E&module=login&rand=sjrand