【Opencv实战】 识别验证码

环境说明

opencv-python          3.4.4.19

pytesseract            0.2.6

tesseract              0.1.3

安装

第一步:安装Tesseract-OCR,下载地址:tesseract-ocr,请记住自己的安装位置,一会儿要用。

第二步:安装tesseract,直接在cmd,命令行输入

pip install tesseract

进行进行自动安装,由于网络问题,这里下载的速度会非常慢,这里给出下载链接。点这里哦

第三步:安装pytesseract,在命令行模式输入:

pip install pytesseract

这个安装的很快。之后通过

pip list

查看是否安装成功

测试

import cv2 as cv
from PIL import Image
import pytesseract 
 
def recognize_text():
    gray = cv.cvtColor(src, cv.COLOR_BGR2GRAY)
    ret, binary = cv.threshold(gray, 0, 255, cv.THRESH_BINARY_INV | cv.THRESH_OTSU)
    kernel = cv.getStructuringElement(cv.MORPH_RECT, (1, 6))
    binl = cv.morphologyEx(binary, cv.MORPH_OPEN, kernel)
    kernel = cv.getStructuringElement(cv.MORPH_RECT, (5, 1))
    open_out = cv.morphologyEx(binl, cv.MORPH_OPEN, kernel)
    cv.bitwise_not(open_out, open_out)  # 背景变为白色
    cv.imshow("dstImage", open_out)
    textImage = Image.fromarray(open_out)
    text = pytesseract.image_to_string(textImage)
    print("Result:%s"%text) 
 
src = cv.imread("yzm.jpg")
cv.imshow("srcImage", src)
recognize_text()
cv.waitKey(0)
cv.destroyAllWindows()

若出现:TesseractNotFoundError: tesseract is not installed or it's not in your path,报错

请将路径:“C:\Program Files\Python36\Lib\site-packages\pytesseract”下的pytesseract.py进行修改:

# CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY
tesseract_cmd = 'tesseract'

请替换为

# CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY
tesseract_cmd = r'D:\Program Files (x86)\Tesseract-OCR\tesseract.exe'

因为这里要更换为自己路径。就是第一步安装Tesseract-OCR的路径。

测试效果

 

测试图片

结果:


★finished by songpl,2019.1.15

 

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
OpenCV可以用于识别图形验证码。一般来说,验证码识别可以分为以下几个步骤: 1. 图像预处理:通过二值化、去噪等方式将验证码图片进行预处理,以便后续处理; 2. 字符分割:将验证码中的每个字符分割出来,以便单独进行识别; 3. 字符识别:使用机器学习或深度学习等方法对每个字符进行识别。 以下是一个简单的示例代码,用于识别由4个字符组成的图形验证码。 ```python import cv2 import numpy as np import pytesseract # 读取验证码图片 img = cv2.imread('captcha.png') # 将图片转换为灰度图 gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) # 二值化处理 ret, thresh = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU) # 去除噪声 kernel = np.ones((3, 3), np.uint8) thresh = cv2.erode(thresh, kernel, iterations=1) thresh = cv2.dilate(thresh, kernel, iterations=1) # 查找轮廓 contours, hierarchy = cv2.findContours(thresh, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE) # 对轮廓进行排序 contours = sorted(contours, key=lambda c: cv2.boundingRect(c)[0]) # 识别每个字符 captcha = '' for contour in contours: # 提取每个字符的ROI x, y, w, h = cv2.boundingRect(contour) roi = thresh[y:y + h, x:x + w] # 将字符缩放为20x20的大小 roi = cv2.resize(roi, (20, 20), interpolation=cv2.INTER_AREA) # 将字符转换为文本 captcha += pytesseract.image_to_string(roi, config='--psm 10') # 输出识别结果 print('验证码为:', captcha) ``` 需要注意的是,验证码识别是一项比较复杂的任务,可能需要根据具体的验证码做出相应的调整和优化。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值