最近突发奇想,想要利用OCR技术来实现图片验证码的识别,这样就不用每次接口测试的时候都找研发给屏蔽掉图片验证了,或者麻烦研发给个万能的验证码。下边就把相应的流程整理下。
这次我们用到的工具是tesseract-ocr,他是由HP实验室开发由谷歌维护的开源OCR(optical character recognition)工具,可以对图片中文字进行识别获取。
一、tesseract-ocr下载:
我们可以到下边的地址进行下载。https://digi.bib.uni-mannheim.de/tesseract/。
二、tesseract-ocr安装:
下载完成后,点击.exe文件进行安装,弹出提示对话框,点击【下一步】
接受协议再次点击下一步