貌似不支持python 3
有空看下
起
首先要知道模拟登陆的网址
公共查询
Ctrl + U 查看一下源码
发现是载入了两个frame,那就直接右键->在新标签打开 学生登录
再看源码,Ctrl + F搜一下input元素,这样就知道要post什么了,或者用浏览器查看下header
总之要传的是
- BtnLogin
- TxtPassword
- TxtStudentId
以及几个hidden的元素,全部搞到,就OK了
#承
用python,安装requests库,这个库有一个超级6的功能
会话对象
然后,就是用正则表达式把hidden的值取出来就好了
到15行的时候 r这个对象已经登上去了,再右键获取本学期课程表的实际URL
发现又是表单
转
同样的方法再用正则表达式搞出来,然后再模拟提交
然后就就得到了课程表的网站源码
合
由于CSDN这个markdown编辑器还是有点不稳定 我最后再贴代码 同时把这个功能放在了YYToolBox上,欢迎试用
# -*- coding:utf-8 -*-
import requests
import re
url = "http://202.120.108.14/ecustedu/K_StudentQuery/K_StudentQueryLogin.aspx"
r = requests.Session()
html = r.get(url)
txt = html.text
str = re.findall('name="\w*" id="\w*" value=".*"', txt);
data = {"BtnLogin": "登录",
"TxtPassword": "",
"TxtStudentId": ""}
for x in str:
name = x.split('"')
data[name[1]] = name[5]
html = r.post(url, data)
url = 'http://202.120.108.14/ecustedu/E_SelectCourse/ScInFormation/syllabus.aspx';
html = r.get(url)
txt = html.text
str = re.findall('name="\w*" id="\w*" value=".*"', txt)
data2 = {'bttn_search': '查询',
'selyeartermflag': '下学期'}
for x in str:
name = x.split('"')
data2[name[1]] = name[5]
html = r.post(url, data=data2)
txt = html.content
arr = txt.split('D>', 1)
txt = arr[0] + 'D>\n<meta charset="UTF-8">' + arr[1]
print(txt)