java识别验证码-用tess4j实现超简单调用tessreact-ocr来破解验证码

直接上操作,

因为tess4j依赖jna,而新版的tess4j和默认的com.sun.jna 3.0.6版本不兼容,它需要先加入这个jna的依赖:

[html]  view plain  copy
  1. <dependency>  
  2.     <groupId>net.java.dev.jna</groupId>  
  3.     <artifactId>jna</artifactId>  
  4.     <version>4.2.1</version>  
  5. </dependency>  

然后加入tess4j的依赖(exclude掉默认的jna):

[html]  view plain  copy
  1. <dependency>  
  2.     <groupId>net.sourceforge.tess4j</groupId>  
  3.     <artifactId>tess4j</artifactId>  
  4.     <version>2.0.1</version>  
  5.     <exclusions>  
  6.         <exclusion>  
  7.             <groupId>com.sun.jna</groupId>  
  8.             <artifactId>jna</artifactId>  
  9.         </exclusion>  
  10.     </exclusions>  
  11. </dependency>  

依赖库就只有这些,不需要加入tessreact-ocr,因为新版tess4j的jar包里面自带了(几十兆)


然后把tessreact项目里面的tessdata文件夹提取出来放在某个位置:https://github.com/tesseract-ocr/tesseract

没完,还要加入验证码识别的相关语言包,姑且叫做训练文件,在这里下载:https://github.com/tesseract-ocr/tessdata

假如你想识别一般的英文数字验证码,就下 eng.traineddata,然后放到tessdata文件夹下,比如:C:\tessdata

最后找一张图片验证码来测试,测试代码:

[java]  view plain  copy
  1. @Test  
  2. public void test() {  
  3.     File imageFile = new File("D:/validcode.jpg");  
  4.        Tesseract tessreact = new Tesseract();  
  5.        tessreact.setDatapath("C:/tessdata");  
  6.        try {  
  7.            String result = tessreact.doOCR(imageFile);  
  8.            System.out.println(result);  
  9.        } catch (TesseractException e) {  
  10.            System.err.println(e.getMessage());  
  11.        }  
  12.    }  
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值