java识别手写文字_Java 实现OCR 识别图像文字(手写中文)----tess4j

最新推荐文章于 2024-10-31 17:16:53 发布

亚赛大人

最新推荐文章于 2024-10-31 17:16:53 发布

阅读量1.1k

点赞数 1

文章标签： java识别手写文字

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_35767338/article/details/114654895

版权

这篇博客介绍了如何使用Tess4J在Java中实现手写中文的OCR识别。首先，下载并安装Tesseract OCR 3.0以上版本，确保包含中文语言库chi_sim.traineddata。接着，添加Tess4J的Maven依赖，并提供一个方法进行文字识别。在Windows环境下测试成功后，在Linux环境中部署需要注意安装Tesseract，配置.so文件，设置语言环境变量以及应对高并发的服务器优化。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

最近有个需要,小程序端手写中文之后生成图像,后端需识别图片上中文..;刚开始想到第三方收费api试试,先用了百度AI开放平台的通用字体识别的API,后来又找到了Tessearct-OCR,参考了几篇文摘整合了一下

准备:

1.下载Tessearct-COR 3.0以上版本:https://download.csdn.net/download/qq_26161693/10646074

2. 在安装时选择chi_sim.traineddata 语言库;之后在程序中需加载安装目录tessdata下的中文包(chi_sim.traineddata );

maven依赖:

net.sourceforge.tess4j

tess4j

3.2.1

Demo:

/**

*

* @param srImage 图片路径

* @param ZH_CN 是否使用中文训练库,true-是

* @return 识别结果

*/

public static String discernWord(String imagePath) {

try {

File image = new File(imagePath);

BufferedImage textImage = ImageIO.read(image);

Tesseract instance = Tesseract.getInstance();

instance.setDatapath("C:\\Program Files (x86)\\Tesseract-OCR\\tessdata");// 设置语言库

instance.setLanguage("chi_sim");// 中文识别

<

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。