javaOCR识别文字

本文介绍了使用Java进行OCR文字识别的两种方法:一种是利用Tesseract,但中文识别效果有限,可能需要训练模型;另一种是借助百度OCR API,提供免费且高准确度的识别,但每日有500次限制。
摘要由CSDN通过智能技术生成

javaOCR识别文字

图片转文字,两种方式实现,一种是使用Tesseract,但是对中文识别支持不是很好,需要自己训练模型。如何训练请自行百度。

另一种是使用百度OCR识别API,需要自己注册获取OCR的key等相关信息,百度有教程。

首先上图

网上下载解压版Tesseract,目录结构如下

项目结构如下

需要下载百度api,java-sdk-4.1.0,百度官网可下

部分代码如下:

通过cmd运行Tesseract识别图片文字

public String recognizeText(File imageFile, String imageFormat) throws Exception {
		// 获取ocr核心包路径
		tessPath = getOCRExePath();
	
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值