jsoup模拟登陆合肥工业大学信息门户
网站:合肥工业大学信息门户登录界面
打开F12调试控制台,登录成功后,发现登陆过程一共跳转了两次,请求了两个文件(不包括原来登陆界面的文件)
一 、login.portal文件
- 注意这是带验证码的登录。
- 这个文件共返回两个cookie,JSESSIONID和cookie,但其实这两个cookie是验证码返回的,主要用来表示验证码,查看验证码图片验证码图片链接,可以看到访问时返回这两个cookie。
- 我们要想模拟登陆成功,就必须获取这两个cookie,同时要能够获取验证码。
- 这里,我使用的是tess4j,来识别验证码图片上的字母,我使用的是maven,只需添加依赖`
<dependency>
<groupId>net.sourceforge.tess4j</groupId>
<artifactId>tess4j</artifactId>
<version>3.2.1</version>
</dependency>
- tess4j同时需要安装训练集,因为验证码为字母数字,我使用的是英文的eng.traineddata下载链接,
放在tessdata目录(这个目录最好放在项目根目录下,这样就不需要额外的配置)下,具体的使用,下面会有代码。
二、userPasswordValidate.portal文件
- 校验用户名和密码是否正确,如果正确,就返回key为iPlanetDirectoryPro的cookie。