小白一枚,自己闲来无事,就想搞个自动批量查询四级成绩的程序,经过不懈努力最终成功,将经验分享,大家共同进步,如有纰漏或可改进地方,望大佬指正,不胜感激
正文:
先上网址:http://www.neea.edu.cn/cet
乍一看,似乎是个很简单的网站,搞起来应该比较轻松,实际操作起来,却发现果然还是有些碰壁
这次我用的库是requests库,然后创建一个session()对象进行请求,这种做法对cookie的操作上来说要方便些
先来常规操作,填入准考证和姓名,抓个包,发现带cookie,what?啥时候出来的cookie?我是隐私窗口打开的,肯定不是以前的cookie,那就很明显了,这个cookie应该是这个网页刚加载的时候在某个请求时设置的,那么我们从头再来
重新抓包,经过观察,发现在load.js的时候就带有cookie了,我们观察cookie:
Hm_lvt_dc1d69ab90346d48ee02f18510292577=1535592621;
Hm_lpvt_dc1d69ab90346d48ee02f18510292577=1535592621
这个15开头的10位数很眼熟吧,一看就是访问时间的时间戳,经过测试,也确实是这样
获得时间戳的代码如下:
这下我们再回到填考生信息的时候,点击验证码框的时候会有这么一个请求,返回信息里面就是验证码图片链接,这个验证码不是加载了现画的那种,是一个验证码对应一张图片提前存放好的,那就简单了,访问图片地址拿到图片数据,识别就完事儿了,请求里面还有个set-cookie,由于用的session对象访问,这个就不需要我们自己管了。值得一提的是