使用office2003附带的MODI可以进行OCR文字识别,不需要取样,使用简单,识别率很不错。
适合用于识别比较规范的文本。缺点是必须安装office2003及Microsoft Document Imaging组件。
这种方法适合于普通文字识别,不太适合做验证码识别。
验证码识别请参考教程:http://www.yhhe.net/ape/book/fap/f2/ix.html
本程序使用了comx插件,请参考贴子:http://www.yhhe.net/bbs/dispbbs.asp?BoardID=4&ID=179&replyID=
下面是演示源代码:
下载模拟精灵: http://www.yhhe.net/Fairy_Ape.exe
打开模拟精灵,把下面的代码粘贴到源码编辑,按F5运行即可。
img = image.new();--创建一个图片对象
img:capture(0,