java tess4j ddl_Java 验证码识别库 Tess4j 学习

最新推荐文章于 2024-07-01 23:31:16 发布

weixin_39550940

最新推荐文章于 2024-07-01 23:31:16 发布

阅读量110

点赞数

文章标签： java tess4j ddl

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39550940/article/details/115073650

版权

【在用java的Jsoup做爬虫爬取数据时遇到了验证码识别的问题(基于maven)，找了网上挺多的资料，发现Tess4j可以自动识别验证码，在这里简单记录下学习过程及遇到的一些问题。】

步骤：

需要在步骤一的tessdata文件中加入相关语言包(训练文件)，在这里下载：https://github.com/tesseract-ocr/tessdata ，如果是简单的英文数字验证码，下载 eng.traineddata然后放到文件夹里即可，中文的是chi开头的traineddata。

导入相关依赖，maven相关依赖如下：

junit

junit

3.8.1

test

net.java.dev.jna

jna

4.2.1

net.sourceforge.tess4j

tess4j

4.1.1

com.sun.jna

jna

4，编写相关代码(自测可正常运行)：

package yanZhengMaTest.pikachu;

import java.io.File;

import net.sourceforge.tess4j.Tesseract;

import net.sourceforge.tess4j.TesseractException;

public class Test {

public static void main(String[] args){

//验证码图片存储地址

File imageFile = new File("C:\\Users\\pc\\Desktop\\1.gif");

if(!imageFile.exists()){

System.out.println("图片不存在");;

}

Tesseract tessreact = new Tesseract();

tessreact.setDatapath("F:\\Program Files (x86)\\Tesseract-OCR\\tessdata");

String result;

try {

result = "测验结果：" + tessreact.doOCR(imageFile);

System.out.println(result);

} catch (TesseractException e) {

e.printStackTrace();

}

}

}

出现异常及处理：

(本人因为开始的时候没用maven导入依赖，自己去下载了各种网上要的jar包去导入，遇到了一堆问题，最后卡在了Invalid memory access这个异常上，后来通过换成maven项目并解决了异常)

A.【Exception in thread "main" java.lang.Error: Invalid memory access：】

如果出现类似于 Invalid memory access的异常

(1). 首先你先确定JAVA代码中：

tessreact.setDatapath("F:\\Program Files (x86)\\Tesseract-OCR\\tessdata");

这里的地址要填你步骤一下载的tessdata文件夹地址。

(2). 如果地址无误，那可能是你tess4j依赖的版本太低，需重新导入依赖，在pom中修改即可。

B.【Exception in thread “main” java.lang.UnsupportedClassVersionError: net/sourceforge/tess4j/Tesseract：】

发生该异常的原因是JDK版本低于1.7，使用1.7以上即可解决问题。

C.【出现图片非法异常】：可能是你图片有问题，换张图片试试，下载的图片不要去修改它的后缀，否则也可能报错。

痛的领悟：

不要直接用java项目自己去导入相关jar包，直接用maven项目去加入依赖包就好，否则可能会出现一堆莫名其妙的异常，个人觉得是因为maven项目依赖包导入时还会导入其他jar包，java项目则需要自己去补增一些jar包，在此建议用maven。

附：

weixin_39550940

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。