下面我们来说说网络上常见的几种验证码识别方式。
先说代码级别的。首先就是谷歌开源的 tesseract 了,这是一个图片识别开源程序,原来是惠普公司自用的程序,后来惠普觉得自己也不怎么用,于是决定将它开源,后经谷歌公司优化清除 bug 从而形成了现在的 tesseract 开源图片识别代码,这一代码有很好的接口,可以通过代码进行调用,极大地方便了程序员的工作,它也有现成的程序,不过是命令行的,可能一般用户不会用。 再说一下用户级别的,也就是一般人可以直接用的。这就不得不说到 ms office 了,微软公司开发的软件,如果用户安装的是完整的 office 那么就会在开始》程序》 microsoftoffice 》 microsoft
office 工具,然后在下面找到 microsoft
office document imaging 这个工具,其中就包括了 ocr 图片识别,可以将图片中的文本识别出来发送到 word 文档中,十分方便,一般人都会用。 还有一些是动态库的识别程序,像这种程序只有程序员才会用上,一般人不了解,像这种程序它不开源,只提供给你二进制动态库文件还有相应的接口,我们不能了解内部到底是个什么样的运行机理,只能用,对于一般的实用主义者来说,只要能用就好,而对于想学习的人来说没有多大价值,这里就不列出来了,反正能搜索得到。
通过上面的列举我们只想说明一个问题,那就是验证码识别技术真不是什么高深的不为人知的技术,但是我们还是想要说,技术就在那里,重要的是你要怎么去整合技术,让它发挥最大的作用。
参考信息:www.zhima365.com