前面已经讲解了tesseract-ocr在vs2008下面的安装调用,这里总结下在vs2010下面的调试,基本和vs2008一样,就是安装目录下lib里面 libtesseract302d.dll 是针对VS2008的,需要用一个vs2010编译出的替换下来才可以在VS2010下正常使用。
一、本文用的是tesseract-ocr-3.02.02的下载地址:http://code.google.com/p/tesseract-ocr/downloads/list
tesseract-ocr-setup-3.02.02.exe | Windows installer of tesseract-ocr 3.02.02 (including English language data) Featured |
然后开始安装tesseract-ocr,直接安装在C:\Program Files (x86)\Tesseract-OCR中,如此很方便,省去很多配置。
需要注意的是,安装目录下lib里面 libtesseract302d.dll 是针对VS2008的,需要用一个vs2010编译出的替换下来才可以在VS2010下正常使用。
另外还需要将 liblept168.dll 和 liblept168d.dll两个文件一并下载放到lib里面。 我这里已经编译好lib和include包,需要的童鞋可以联系我,我直接发给你,直接放到C:\Program Files (x86)\Tesseract-OCR下面即可。
二、修改环境变量Path
在环境变量Path中增加指向安装目录下lib的路径,比如
二、修改环境变量Path
在环境变量Path中增加指向安装目录下lib的路径,比如C:\Program Files (x86)\Tesseract-OCR\lib ,以便exe运行时能找到所需要的dll。
三、工程中属性中增加路径
在自己的工程属性中增加包含目录和库目录,以便VS2010查找文件。
在显示以下内容的目录中
包含文件 下新增:C:\Program Files (x86)\Tesseract-OCR\include\tesseract
库文件 下新增: C:\Program Files (x86)\Tesseract-OCR\lib
四、增加语言训练包
直接将语言训练包放置在安装目录tessdata文件夹下就好,比如将tesseract-ocr-3.02.chi_sim.tar.gz中的chi_sim.traineddata 文件直接抽取出来放在
四、增加语言训练包
直接将语言训练包放置在安装目录tessdata文件夹下就好,比如将tesseract-ocr-3.02.chi_sim.tar.gz中的chi_sim.traineddata 文件直接抽取出来放在 C:\Program Files (x86)\Tesseract-OCR\tessdata 下面,就可以支持中文简体字符的识别。当然,自己训练出来的sam.traineddata 文件也是要放在这里的才生效。
五、配置完毕,可以进行调试。