Python之验证码识别

今天主要对数字验证码识别,利用

pytesseract

百度一下python安装这个模块,另外这个模块需要下载Tesseract-OCR,对应的系统。

 

此外最好配置下环境变量,这样就可以直接在cmd中调用了。

python用 pytesseract 调用这个下载的识别exe,

 

from pytesseract import *

if __name__ == '__main__':
    pytesseract.tesseract_cmd = "D:\software\Tesseract-OCR\\tesseract.exe"
    text = pytesseract.image_to_string("2.png")
    print(text)

由于 pytesseract.tesseract_cmd 这个是作者定义的常量,就是那个OCR的路径,自己把自己的填进去覆盖常量->如果没配置环境变量。

接下来对图像处理,让OCR更好的识别。

一般处理就这个步骤,,灰度->二值化->降噪->倾斜度->分割(大体处理顺序应该没关系)

我这边简单的处理了一下。自己不会写的也可以百度。

import cv2
from PIL
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值