java识别图片上的文字

最新推荐文章于 2024-06-06 19:55:33 发布

Z丶royAl

最新推荐文章于 2024-06-06 19:55:33 发布

阅读量4.8w

点赞数 2

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_15260315/article/details/88573500

版权

一、需要用到Tesseract-OCR所以先下载，并安装

二、配置环境变量，在系统环境变量中，Path添加C:\Program Files (x86)\Tesseract-OCR；新建变量TESSDATA_PREFIX，变量值为C:\Program Files (x86)\Tesseract-OCR\tessdata

三、开始识别

（1）例如C:\Users\dell\Desktop\test\test.jpg的图片

（2）测试识别效果

识别图片命令

tesseract 图片名称 生成的结果文件的名称 字库

cmd命令行进入图片所在文件夹位置，输入命令（其中chi_sim是中文的字库），result是在当前文件夹下生产一个result.txt文件并写入识别的内容

tesseract test.jpg result -l chi_sim

（3）打开result.txt文件，识别的不是很准确，可以对字库进行训练

四、训练字库

（1）需要下载jTessBoxEditor工具，jTessBoxEditor是java写的，所以需要安装jdk

（2）修改图片名字，不能随意命名，有固定的格式，这里我把图片名字改成cs.roy.ex

最低0.47元/天解锁文章

关注

2
点赞
踩
40

收藏

觉得还不错? 一键收藏
1
评论
java识别图片上的文字

一、需要用到Tesseract-OCR所以先下载，并安装二、配置环境变量，在系统环境变量中，Path添加C:\Program Files (x86)\Tesseract-OCR；新建变量TESSDATA_PREFIX，变量值为C:\Program Files (x86)\Tesseract-OCR\tessdata三、开始识别（1）例如C:\Users\dell\Desktop...
复制链接

扫一扫

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。