关于图片验证码的文章,我想大家都有一定的了解了。
在我们做UI自动化的时候,经常会遇到图片验证码的问题。
当开发不给咱们提供万能验证码,或者测试第三方网站比如知乎的时候,我们就需要自己去识别验证码。
OCR
OCR是一种图像文字识别的技术,例如图中的验证码,我们用肉眼识别就是c5s3,但机器可不比咱们肉眼。所以我们要利用ocr技术,让我们的Python脚本自动通过图片识别出对应的文字。
常见的识别类库
在Python中其实有许多识别类库,这里只介绍博主自己实践过的成功率还不错的: 百度ocr。
简单的说,就是百度提供了一个SDK,让我们传入图片数据,从而拿到识别的结果。ocr的细节我们不需要关心。
申请开通OCR
首先我们得有一个百度账号,这个相信大家都有,没有的可以申请一个。
·登录百度控制台
进入https://login.bce.baidu.com/并登录。
· 选择文字识别
左上角展开->产品服务->文字识别