使用Springboot + Tesseract OCR引擎实现图片文字自动识别

一、简介

1.1关于项目

Tesseract是一款优秀的开源OCR软件,是由HP实验室开发,Google维护的开源OCR(Optical Character Recognition , 光学字符识别)引擎,与Microsoft Office Document Imaging(MODI)相比,我们可以不断的训练的库,使图像转换文本的能力不断增强;如果团队深度需要,还可以以它为模板,开发出符合自身需求的OCR引擎。

目前由Google维护改进,已发展到5.0版本,从4.0版本起增加了基于LSTM神经网络的识别引擎

本项目使用Springboot + Tesseract OCR引擎实现图片文字自动识别功能。

1.2准备

JDK:17

Maven:3.6

开发工具:IntelliJ IDEA

Tesseract模型文件:chi_sim.traineddata

本项目源代码:可私信提供

1.3Tesseract模型文件下载

GitCode - 开发者的代码家园

项目文件预览 - tessdata - GitCode

​</

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值