机器学习项目案例简单的数字验证码自动识别

最新推荐文章于 2024-07-01 08:28:47 发布

Mr_fengzi

最新推荐文章于 2024-07-01 08:28:47 发布

阅读量2.5k

点赞数 2

分类专栏：机器学习文章标签：验证码自动识别

本文链接：https://blog.csdn.net/Mr_fengzi/article/details/99293118

版权

本篇文章将实现一个识别验证码的案例。
基本思路及步骤：
1.先写一个关于验证码生成器的代码，得到一个有关验证码的库
2.对验证码库中的验证码图片进行处理并对其分割
3.训练数据，得到模型
4.对未知的验证码图片进行预测

由于目前的验证码的形式比较多样，但是验证的思路都是类似的，因此就先从简单的数字开始进行识别。我们先需要写一个验证码生成器，生成验证码库。
验证码需要有5个数字，并且有不同的颜色，还要再图片上加一些噪点和一些随机的线。
代码如下：

from PIL import Image
from PIL import ImageDraw
from PIL import ImageFont
import random

def getRandomColor():
    """
    获取一个随机颜色(r,g,b)格式的
    :return:
    """
    c1 = random.randint(0, 255)
    c2 = random.randint(0, 255)
    c3 = random.randint(0, 255)
    if c1 == 255:
        c1 = 0
    if c2 == 255:
        c2 = 0
    if c3 == 255:
        c3 = 0
    return(c1, c2, c3)

def getRandomStr():
    """
    获取一个随机数字，每个数字的颜色也是随机的
    :return:
    """
    random_num = str(random.randint(0, 9))
    return random_num

def generate_captcha():
    # 获取一个Image对象，参数分别是RGB模式。宽150，高30， 随机颜色
    image = Image.new('RGB', (150, 50), (255,255,255))
    # 获取一个画笔对象，将图片对象传过去
    draw = ImageDraw.Draw(image)
    # 获取一个font字体对象参数是ttf的字体文件的目录，以及字体的大小
    font = ImageFont.truetype("ARLRDBD.TTF", size=32)

    label = ""

    for i in range(5):
        random_char = getRandomStr()

        label += random_char

        # 在图片上写东西，参数是：定位，字符串，颜色，字体
        draw.text((10+i*30, 0), random_char, getRandomColor(), font=font)

    # 噪点噪线
    width = 150
    height = 30
    # 画线
    for i in range(3):
        x1 = random.randint(0, width)
        x2 = random.randint(0, width)
        y1 = random.randint(0, height)
        y2 = random.randint(0, height)
        draw.line((x1, y1, x2, y2), fill=(0, 0, 0))
    # 画点
    for i in range(5):
        draw.point([random.randint(0, width), random.randint(0, height)], fill=getRandomColor())
        x = random.randint(0, width)
        y = random.randint(0, height)
        draw