ocr模型识别验证码打码识别，本地CPU运行+python源码

最新推荐文章于 2024-04-23 09:48:39 发布

welin_

最新推荐文章于 2024-04-23 09:48:39 发布

阅读量640

点赞数 10

文章标签： ocr python 计算机视觉

本文链接：https://blog.csdn.net/welin_/article/details/137630795

版权

**为了识别像下面这种简单的验证码，下面有一个完整的解决流程
下载.jpeg **

解决方案，具体技术如下：

1，对验证码图像进行处理
2，使用orc识别图片

下面我们进行详细的说明

1，对验证码图像进行处理

为啥要处理图像？这是因为这个验证码有很多干扰线条，你看这个上面的图，它的背景有很多的线条和斑点

而我们想要的只是黑色的文字主体

下面我们就开始去掉他们。
这里我们使用python的opencv对图片进行处理
（1）先把图片变成黑白（也就是灰度图）然后再将其模糊话（也就是高斯模糊）就变成下面的样子了

是不是看起来没啥，干扰还在，看着头晕晕的，别着急，其实这时候，你会发现4nvu很显眼了。下面还有一步处理。
（2）对图像进行阈值处理，然后就得到了下面的图

我靠！！！！干扰线条绝户啦
好了，现在我们就可以使用这个图进行ocr了，这里补充一下上面图像处理的代码

import cv2


def denoise_image(image_path):
    # 读取图像
    image = cv2.imread(image_path)

    # 将彩色图像转换为灰度图像
    gray_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

    # 使用高斯模糊降噪
    blurred_image = cv2.GaussianBlur(gray_image, (5, 5), 0)

    # 将降噪后的图像覆盖原始图像
    cv2.imwrite(image_path, blurred_image)

def threshold_image(image_path, threshold_value):
    # 读取图像
    image = cv2.imread(image_path, cv2.IMREAD_GRAYSCALE)

    # 对图像进行阈值处理
    ret, thresholded_image = cv2.threshold(image, threshold_value, 255, cv2.THRESH_BINARY)

    # 将阈值处理后的图像覆盖原始图像
    cv2.imwrite(image_path, thresholded_image)

# 测试方法
image_path = '1.jpeg'  # 替换为您的图片路径
threshold_value = 120  # 阈值
denoise_image(image_path) 
threshold_image(image_path, threshold_value)

2，使用ocr识别图片

好了，现在已经有了一个清晰的图了，接下来就是ocr了，我本来是想使用别人的接口进行识别的，奈何大家都不太愿意被白嫖，用一用就收费了，没办法，我就自己找模型识别吧
我使用的是 Paddle OCR 模型进行识别，这个模型很小，用cpu跑的，只有十几兆。
具体操作流程如下：
（1）安装paddle

pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple

（2）安装paddlehub

pip install paddlehub -i https://mirror.baidu.com/pypi/simple

（3）安装ocr模型

hub install ch_pp-ocrv3==1.2.0

（4）运行我的脚本

import paddlehub as hub
import cv2
ocr = hub.Module(name="ch_pp-ocrv3", enable_mkldnn=True)       # mkldnn加速仅在CPU下有效
result = ocr.recognize_text(images=[cv2.imread('1.jpeg')])
print(result[0]["data"][0]["text"])

最后打印出来的结果如下图

这个里有空格，所以，直接去一下空格，对脚本改进一下

import paddlehub as hub
import cv2
ocr = hub.Module(name="ch_pp-ocrv3", enable_mkldnn=True)       # mkldnn加速仅在CPU下有效
result = ocr.recognize_text(images=[cv2.imread('1.jpeg')])
print(result[0]["data"][0]["text"].replace(" ",""))

得到结果

这就是完整的解决流程
当然实际使用的时候哦，我们可能是直接读取图片文件，然后直接识别的，所以我写了一个demo，可以参考使用

import paddlehub as hub
import cv2
from PIL import Image
from io import BytesIO
import base64

def denoise_image(image_path):
    # 读取图像
    image = cv2.imread(image_path)

    # 将彩色图像转换为灰度图像
    gray_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)