jsoup模拟登陆合肥工业大学信息门户

本文介绍如何利用jsoup库模拟登陆合肥工业大学信息门户。登录过程涉及login.portal、userPasswordValidate.portal和index.portal三个文件的交互,其中login.portal用于验证码验证,userPasswordValidate.portal校验用户名和密码,index.portal则需要所有必要的cookies。为了识别验证码,作者使用了tess4j库,并详细介绍了依赖添加及验证码识别的步骤。
摘要由CSDN通过智能技术生成

网站:合肥工业大学信息门户登录界面
打开F12调试控制台,登录成功后,发现登陆过程一共跳转了两次,请求了两个文件(不包括原来登陆界面的文件)
控制台截图

一 、login.portal文件

  • 注意这是带验证码的登录。
  • 这个文件共返回两个cookie,JSESSIONID和cookie,但其实这两个cookie是验证码返回的,主要用来表示验证码,查看验证码图片验证码图片链接,可以看到访问时返回这两个cookie。
    cookie
  • 我们要想模拟登陆成功,就必须获取这两个cookie,同时要能够获取验证码。
  • 这里,我使用的是tess4j,来识别验证码图片上的字母,我使用的是maven,只需添加依赖`
<dependency>
    <groupId>net.sourceforge.tess4j</groupId>
    <artifactId>tess4j</artifactId>
    <version>3.2.1</version>
</dependency>
  • tess4j同时需要安装训练集,因为验证码为字母数字,我使用的是英文的eng.traineddata下载链接
    放在tessdata目录(这个目录最好放在项目根目录下,这样就不需要额外的配置)下,具体的使用,下面会有代码。

二、userPasswordValidate.portal文件

  • 校验用户名和密码是否正确,如果正确,就返回key为iPlanetDirectoryPro的cookie。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值