“觊觎”教务网不是一天两天了。。
之前试过selenium,结果失败。
昨天爬下来了,发现竟如此简单!
整个过程仅花核心代码30余行。
一、步骤
1、首先查看分析
打开界面是这样
查看源码是这样
什么都没有,难怪用selenium定位不到了。估计还得配合PhantomJS来渲染页面,麻烦呀。于是想到抓包,一下就抓出来了。
2、抓包
抓包过程就不赘述,详情也可见我上一篇文章
http://www.jianshu.com/p/1f44a9a2ddd8
最终获得成绩的真实URL地址。
3、下载数据
最先是试着不登