tesseract5.0+tesstrain+tess4j识别验证码_JAVA_MAC

本文介绍了在Mac上使用Tesseract5.0、tesstrain和Tess4J进行图片识别,特别是验证码识别的流程。包括通过gradle配置Tess4J库,解决mac系统依赖问题,训练图片,处理tif图片的dpi,以及转换jpg为tif。训练后的hx.traineddata文件可用于提高复杂图片如验证码的识别率。
摘要由CSDN通过智能技术生成

1、Java项目中引入tess4j库,用gradle配置如下:

    implementation 'net.sourceforge.tess4j:tess4j:5.2.0'

2、安装Tesseract5.0

因Tess4j无法在mac系统使用,报错找不到一些依赖的类库,所以必须安装tesseract5.0.

安装可以用:

brew install tesseract

如果要用图片训练tesstrain,则需要从github下源代码编译(GitHub - tesseract-ocr/tesseract: Tesseract Open Source OCR Engine (main repository)),本人这里需要用训练,所以是下载代码编译的,过程比较复杂,可以直接它的安装文档进行安装。

3、设置java运行变量tessdata的位置,如下。

 4、以上步骤完成,运行java就能识别图片了。

这个识别对于干净整洁的英文数字图片识别效果不错,但是像验证码这种有很多干扰项的图片,识别正确率就很低了,可以运动训练工具提高识别率。

补充&

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值