java图片片识别中文_Java中使用tess4J进行图片文字识别(支持中文)

最新推荐文章于 2024-06-06 09:33:08 发布

沈逸老师

最新推荐文章于 2024-06-06 09:33:08 发布

阅读量338

点赞数

文章标签： java图片片识别中文

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_29093169/article/details/114761847

版权

Java 版本：建议JDK1.8

使用的软件是tesseractocr3.02，3以后的版本才支持中文, 这个软件需要安装在本地电脑中，安装的过程中全部都按照默认进行安装(以便于Java直接调用)

代码及所使用的软件插件及jar包地址如下:

https://download.csdn.net/download/weixin_40461281/10609983

该软件默认的识别的是英文，如果相要能识别中文，需要将中文的训练文本chi_sim.traineddata存放到(安装路径下\Tesseract-OCR\tessdata)中

Java中识别的话很简单 , 下面是封装的工具类

import net.sourceforge.tess4j.Tesseract;

import javax.imageio.ImageIO;

import java.awt.image.BufferedImage;

import java.io.File;

import java.io.IOException;

public class OCR {

/**

*

* @param srImage 图片路径

* @param ZH_CN 是否使用中文训练库,true-是

* @return 识别结果

*/

public static String FindOCR(String srImage, boolean ZH_CN) {

try {

System.out.println("start");

double start=System.currentTimeMillis();

File imageFile = new File(srImage);

if (!imageFile.exists()) {

return "图片不存在";

}

BufferedImage textImage = ImageIO.read(imageFile);

Tesseract instance=Tesseract.getInstance();

instance.setDatapath("C:\\Program Files (x86)\\Tesseract-OCR\\tessdata");//设置训练库

if (ZH_CN)

instance.setLanguage("chi_sim");//中文识别

String result = null;

result = instance.doOCR(textImage);

double end=System.currentTimeMillis();

System.out.println("耗时"+(end-start)/1000+" s");

return result;

} catch (Exception e) {

e.printStackTrace();

return "发生未知错误";

}

}

public static void main(String[] args) throws Exception {

String result=FindOCR("D:\\test2.png",true);

System.out.println(result);

}

}

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
java图片片识别中文_Java中使用tess4J进行图片文字识别(支持中文)

Java 版本：建议JDK1.8使用的软件是tesseractocr3.02，3以后的版本才支持中文, 这个软件需要安装在本地电脑中，安装的过程中全部都按照默认进行安装(以便于Java直接调用)代码及所使用的软件插件及jar包地址如下:https://download.csdn.net/download/weixin_40461281/10609983该软件默认的识别的是英文，如果相要能识别中文，...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。