【AI实战】手把手教你实现文字识别模型（入门篇：验证码识别）

最新推荐文章于 2024-04-24 15:28:32 发布

雪饼ai

最新推荐文章于 2024-04-24 15:28:32 发布

阅读量8.5k

点赞数 4

分类专栏：人工智能文章标签：人工智能深度学习 OCR 文字识别 tensorflow

本文链接：https://blog.csdn.net/rogerchen1983/article/details/92434858

版权

文字识别在现实生活中有着非常重要的应用，主要由文字检测、内容识别两个关键步骤组成，在本博客之前的文章中已介绍了文字检测、内容识别的经典模型原理（见文章：大话文本检测经典模型：CTPN ，大话文本识别经典模型：CRNN），本文主要从实战的角度介绍如何实现文字识别模型。

在之前的文章中，已经介绍过了跟文字识别相关的实战内容：基于MNIST数据集识别手写数字的实战内容（见文章：训练你的第一个AI模型：MNIST手写数字识别模型），这个相对简单。今天再介绍文字识别的另一个经典应用：验证码识别，作为文字识别的实战入门篇。

验证码在手机APP、WEB网站中非常普遍，主要是为了防止恶意登录、刷票、灌水、爬虫等异常行为，也可能是为了缓解系统的后台压力（例如在秒杀、抢票时，强制要求输入验证码）。本文主要介绍文本型验证码的识别，文本型验证码由数字、英文大小写字母，甚至中文随机组成，再进行变形扭曲、加干扰线、加背景噪音等操作，主要是为了防止被光学字符识别（OCR）之类的程序自动识别出图片上的文字而失去效果，如下图：

由于存在着比较强的干扰信息，因此，直接使用OCR进行识别，效果很不理想，而通过AI可很好地实现这种复杂信息的识别。目前百度等AI开放平台，也提供了验证码识别的开放接口，但由于验证码可由各APP、网站根据任意自定的规则随机组合生成，因此，这些AI平台的验证码识别开放接口在某些场景下效果很好，在某些场景下可能就失灵了。针对具体的场景，我们通过自己训练验证码识别的AI模型，能很好地解决该场景下的验证码识别问题。

下面开始介绍使用Tensorflow构建验证码的识别模型，主要步骤如下：

step 1. 获取验证码图片
step 2. 图片标注
step 3. 训练模型
step 4. 模型应用

1、获取验证码图片

（1）如果是自己练习的，可直接随机生成验证码图片作为基础数据集。在python里面使用captcha库来快速生成验证码图片，通过pip install captcha进行安装，或者手动下载captcha-0.3-py3-none-any.whl文件进行安装。（注：anaconda无法通过conda install 直接安装captcha，但可使用anaconda里面的pip来安装captcha），核心代码如下：

from captcha.image import ImageCaptcha
import random

# 生成验证码的字符集
CHAR_SET = ['0','1','2','3','4','5','6','7','8','9']
CHAR_SET_LEN = len(CHAR_SET)

# 验证码长度
CAPTCHA_LEN  = 4

for i in range(CHAR_SET_LEN):
    for j in range(CHAR_SET_LEN):
        for k in range(CHAR_SET_LEN):
            for l in range(CHAR_SET_LEN):
                captcha_text = CHAR_SET[i] + CHAR_SET[j] + CHAR_SET[k] + CHAR_SET[l]
                image = ImageCaptcha()
                image.write(captcha_text, '/tmp/mydata/' + captcha_text + '.jpg')

生成的效果如下图

（2）如果是要针对某个网站的验证码进行识别的，则可使用一些工具将对应的验证码下载下来。一般网站登录的界面如下：

最低0.47元/天解锁文章

雪饼ai

关注

4
点赞
踩
52

收藏

觉得还不错? 一键收藏
0
评论
【AI实战】手把手教你实现文字识别模型（入门篇：验证码识别）

文字识别在现实生活中有着非常重要的应用，主要由文字检测、内容识别两个关键步骤组成，在本博客之前的文章中已介绍了文字检测、内容识别的经典模型原理（见文章：大话文本检测经典模型：CTPN，大话文本识别经典模型：CRNN），本文主要从实战的角度介绍如何实现文字识别模型。在之前的文章中，已经介绍过了跟文字识别相关的实战内容：基于MNIST数据集识别手写数字的实战内容（见文章：训练你的第一个AI...
复制链接

扫一扫