1.安装ocr识别软件(本人使用的是:tesseract-ocr-setup-3[1].00)
2.需要设置系统变量:path C:\Program Files\Tesseract-OCR\
3.字库添加在C:\Program Files\Tesseract-OCR\tessdata(ocr字库文件夹)文件夹中
(新字库的创建方法可以看:http://blog.csdn.net/dyfleoo/article/details/6959591)
到此ocr软件已安装完毕;
JAVA中调用ocr识别图片:
/**
*inputImageURL 需要识别的图片路径
*outputImageURL 输出文件路径(为TXT文件用来装载识别出来的内容)
*language 对应的字库文件名
*/
public boolean ocr(String inputImageURL,String outputImageURL,String language){
File file=new File(inputImageURL);
if(file.exists()==false)
{
System.out.println("源图片不存在");
return false;
}
String[] str={"\""+"C:\\Program Files\\Tesseract-OCR"+ File.separator +"tesseract.exe\"",
"\""+inputImageURL+"\"",
"\""+outputImageURL+"\"",
"\"-l\"",
//"\"idcard\""};
//"\"chi_sim\""};
"\""+language+"\""};
//"\"yxqdigits\""};
return executeRunTime.execute(str);
}