windows用户可直接使用tess4j最新的api调用(有maven库),直接跳到第三步验证
转载自 http://www.microshell.com/programming/java/performing-optical-character-recognition-in-java/
若不想多看下面步骤,可直接下载上传的编辑后的jar包版本:tess4j-3.4.3 适用于mac版本
http://download.csdn.net/download/qq_38113432/10259023
一、通过macports安装Tesseract
命令如下:
sudo port install Tesseract
中间可能会有如下一步,填写y继续即可。
二、将darwin / libtesseract.dylib 加入jar包中
mkdir darwin
jar uf tess4j-xxx.jar darwin
cp /opt/local/lib/libtesseract.3.dylib darwin/libtesseract.dylib
jar uf tess4j-xxx.jar darwin/libtesseract.dylib
jar tf tess4j-xxx.jar
成功加入之后即可看到
接下来将修改后的jar包导入项目中即可使用了,下面会附上一个小例子验证。
三、tess4j实例
public static void main(String[] args) {
try {
File imageFile = new File("./0056.png");//图片位置
ITesseract instance = new Tesseract(); // JNA Interface Mapping
// instance.setLanguage("osd");//选择字库文件(只需要文件名,不需要后缀名)
String result = instance.doOCR(imageFile);//开始识别
System.out.println(result);//打印图片内容
} catch (TesseractException e) {
e.printStackTrace();
}
}
成功后将输出正确的验证码,如下所示:
最后祝大家新的一年,大吉大利~