1.今天和同事研究如何用java实现图片识别。百度上大部分都是用tesseract去实现的。所以就做了一个demo
(1)。首先下载Tesseract-OCR 3.02,以及中文包chi_sim.traineddata(简体)
(2)以下介绍两种方式
cmd 方式 和 test4j方式
CMD方式:
(2.1)下载安装后打开cmd命令行,输入 tesseract,如果出现下图说明安装成功
(2.2)、命令行测试使用
接下来就可以使用tesseract进行图片识别了。准备一副待识别的图像,这里用画图工具随便写了一段字,然后定义成1.jpg
$ \4 X2 p" S0 A& Y% a
在命令行中定位到图片路径然后输入命令: