开始学习php,就想用php抓个课表试试。网上看了好几位的经验介绍,就试着做了下,由于几篇文章时间比较久了,实验并不成功,然后自己琢磨了下,弄出来一个可行。今天分享下。
首先你要知道学校教务系统登录的网址(例如:http://210.44.159.22/default2.aspx),然后由于我们学校正方系统修复了绕过验证码的bug,所以还免不了需要填写下验证码。所以还需要验证码地址(例如:http://210.44.159.22/CheckCode.aspx).
知道地址后,用chrome浏览器按f12打开调试模式,点击network,看看登陆具体提交了那些数据段。
这里可以看到提交的数据,txtUserName是你的学号,textBox2是你提交的密码,然后通过查看网页源码可以发现_VIEWSTATE是一个隐藏字段,RadioButtonList1就是学生.知道这些,我们就可以开始模拟登陆的工作了.
第一步:利用php的curl模拟去请求登陆页面,会返回登陆页面,然后利用正则表达式可以提取出_VIEWSTATE字段的内容,同时还要获取到这个页面的cookie,用这个cookie去请求验证码图片,这样才能保证验证码一致。这里得到的cookie和_VIEWSTATE要留下来,后面模拟登陆用的到。我看到其他人的做法是把cookie保存为文件后面再读。我的做法是在一个php文件中,把获取到的登陆页面cookie和_VIEWSTATE保存为cookie,然后输出验证码图片,在html代码中引用就可以显示验证码图片了(例如<img src="codeimg.php">)。然后写了一个登录的php去读这个cookie。下面是codeimg.php
<?php
header("Content-Type: application/json; charset=gbk");
header("Content-Type: image/jpeg");
$url=