最近都在搞和爬虫相关的东西,在搞完学校新闻模拟登录后,就感觉有种一丢丢的成就感,所以心血来潮想自己弄一个教务系统出来。在之前实现模拟登陆的时候本人无法通过HttpWatch进行分析,因为登陆界面是在外网的时候才会出现,所以但是就用手机把网页下载下来进行分析,然后找出需要post的参数,然后实现模拟登录。按照这样的思路,无疑我会用这种思路去实现登录正方系统,但是结果尝试很多次都不行。结果通过HttpWatch观察发现post的时候还有一个隐藏的参数,所以之前才会行不通.
以下是效果图:
实现以上的各种功能其实关键在于把协议给弄清楚。首先需要我们注意的是登录需要帐号,密码和验证码,而通过httpwatch不难发现,其实我们访问整个过程中我们都需要用到我们验证码所带的Cookie。换句话来说,我们要在获取到验证码图片的时候,获取到我们需要的Cookie信息。
以下是HttpWatch抓到验证码的信息:
通过获取验证码,我们会将cookie保存下来,保存下来有什么用?看看下面这图就知道了
以下是我登录正方系统后所抓到的信息:
我们可以看到我们请求登录的时候请求头所带的cookie正是我们刚刚获取到验证码的时候所带的cookie,这就是为什么我们获取到验证码时要保存cookie的原因。
接着我们再来看一下这个post请求里面的信息,里面有__ViewStat(