java ocr引擎_java 实现 OCR 图片文字识别

本文介绍了如何使用Java调用Tesseract-OCR引擎进行图像文字识别,包括TESSERACT-OCR的安装、环境配置、解决找不到语言数据文件的问题,以及通过Tess4J库进行代码测试,成功实现OCR识别。
摘要由CSDN通过智能技术生成

OCR图像识别技术的JAVA实现

最近有个需求需要用图像识别,学习记录一下。

目前网络上的开源的图像识别技术有很多,例如 OCRE(OCR Easy)、Clara OCR、OCRAD、TESSERACT-OCR 等。

今天本blog将记录下tesseract-ocr的JAVA实现,便于以后查阅使用。

开源 ocr 引擎

我们本次直接以排名第一的 TESSERACT-OCR 作为例子。

TESSERACT-OCR 安装

本次测试的环境为 windows10,所以下载 windows 相关的安装包。

windows 下载地址

安装

安装完毕后,目录下:

直接双击 exe,然后安装。

878be4b0c2e5f44907d1c67cd22e6450.png

指定安装特定语言包

这里我们安装一下中文的语言训练包。

【chinese】相关的四个,简体,繁体(分别对应的默认和垂直。)

比较悲催的是全部下载失败。

安装路径

使用默认路径:

C:\Program Files (x86)\Tesseract-OCR

结果

λ ls

ambiguous_words.exe* libcairo-2.dll* libgomp-1.dll* libpangocairo-1.0-0.dll* libwebp-7.dll* tesseract.exe*

classi

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值