我的新博客地址:
http://jujuba.me/
0x00. 准备工作
工具:
- chrome
- python
- 一些python库,主要是requests
要想爬进教务系统,首先要知道教务系统的网址对吧。
这边可以看到网址是http://jwgl.bistu.edu.cn
。但是,机智的人都会发现,当你将这个url输入地址栏并按下回车时,网址变了,变成了形如http://jwgl.bistu.edu.cn/(d5njjm552sqn0j45ijyef3jn)/default2.aspx
这样的地址。多试几次后发现括号内的值一直在变,是一个随机生成的值,但是呢,url里直接带上这个随机生成的值也可以访问同一个页面。这样就比较好办了,直接第一次访问后将括号里的值用正则匹配并保存下来即可。目测这个东西是用来防爬虫的
0x01. 查看表单
首先,需要准备一个chrome,firefox也可以,这边用chrome讲解。
进到