一.tesseract的安装
下载这个压缩包即可
解压后直接双击文件夹内的.exe文件安装就好了,安装完后需要开始配置环境变量,就是把你安装tesseract的安装路径复制到环境变量中
在cmd里面输入如下代码,如果出现下方的4.00.00的版本号说明安装成功
二.在cmd中测试tesseact的识别率
下面我在cmd中来测试一下这个开源的验证码识别率,就以下面三张图片为例
可以看出此次识别与实际不一样
第二张也未能识别
此处才识别成功,可以看到这个开源的验证码识别器的识别率只有30%-50%左右
三.在pycharm中使用tesseract识别
在使用之前需要先安装两个库(pytesseract 和pillow)
四.总结
总结 : 通过以上测试这个开源的验证码识别率太低,所以我们在今后的数据抓取在需要验证码识别时,不推荐使用tesseract,在下一张我会给大家继续更新,去使用我们第三方的打码平台,它的识别率可以达到80%-90%,给个三连支持一下吧