最近闲来无事研究了一下用Java如何模拟浏览器的行为,在实验登录的步骤时碰到了识别验证码的问题,于是在网上查找了关于Java如何进行图片识别验证码,由于根据网上查找的相关文章都不适合我的配置,所以特开此博客进行记录一下采坑的过程以及解决方法。
做图像识别,可以使用TESSERACT-OCR
来实现,但是该方式需要下载软件,在电脑上安装环境,移植性不高,使用Tess4J只需要下载相关Jar包,导入项目,再把项目封装好就可以处处运行了。
首先说一下我使用的电脑和JDK版本
- 电脑:MacBook
- JDK版本:1.8
接下来说一下需要哪几步骤
- 引入
Tess4J
Jar包 - 使用brew安装
tesseractt
- 下载语言包
只需要上面简单的三步就可以在本机上使用Java进行图片验证码识别了。接下来我们详细讨论下这三个过程。
引入Tess4J
如果是Maven的话直接在下面引入即可
<dependency>
<groupId>net.sourceforge.tess4j</groupId>
<artifactId>tess4j</artifactId>
<version>3.2.1</version>
</dependency>
如果是Gradle