一个字符训练材料生成的小文件

最新推荐文章于 2024-05-02 17:31:38 发布

程序猿的冒险谭

最新推荐文章于 2024-05-02 17:31:38 发布

阅读量4.6k

点赞数

分类专栏：训练数据文章标签：神经网络

本文链接：https://blog.csdn.net/qq_51324662/article/details/114249220

版权

训练数据专栏收录该内容

1 篇文章 0 订阅

订阅专栏

前几天想训练一个可以识别字符的模型，但是，苦于找不到训练材料，今天，做网站验证码时候发现了一个思路，写下来分享一下。

from captcha.image import ImageCaptcha
import random,string
import numpy as np
cq=0
str_1=""
#这里我修改了一下源码源码width为160
while cq<10:
    cq+=1
    chr_all = string.ascii_letters + string.digits
    #生成验证码的个数
    chr_4 = ''.join(random.sample(chr_all, 1))
    image = ImageCaptcha().generate_image(chr_4)


    #对图片进行降噪处理
    from PIL import Image
    #获取图片对象

    #转换为灰度图片
    imgGray = image.convert('L')
    #查看图片
    #imgGray.show()

    #设置阈值
    threshold = 200
    #加载像素点
    pixdata = imgGray.load()
    #获取图片的宽高
    width, height = imgGray.size
    for y in range(height):
        for x in range(width):
            if pixdata[x, y] < threshold:
                pixdata[x, y] = 0
            else:
                pixdata[x, y] = 255
    binImg  = imgGray
    a=0
    while a<=15:
        a+=1
        pixdata = binImg.load()
        width, height = binImg.size
        for y in range(1, height- 1):
            for x in range(1, width- 1):
                count = 0
                if pixdata[x, y - 1] > 245:
                    count = count + 1
                if pixdata[x, y + 1] > 245:
                    count = count + 1
                if pixdata[x - 1, y] > 245:
                    count = count + 1
                if pixdata[x + 1, y] > 245:
                    count = count + 1
                if pixdata[x - 1, y - 1] > 245:
                    count = count + 1
                if pixdata[x - 1, y + 1] > 245:
                    count = count + 1
                if pixdata[x + 1, y - 1] > 245:
                    count = count + 1
                if pixdata[x + 1, y + 1] > 245:
                    count = count + 1
                if count > 4:
                    pixdata[x, y] = 255

    nrImg = binImg
    c=np.array(nrImg)
    strs=""
    for arr in c:
        strs =strs+ ','.join(str(i) for i in arr)+","
    #print(strs,len(strs))
    str_1=str_1+chr_4+","+strs+"\n"

with open("train_test_letter_exam.csv","w") as f:
    f.write(str_1)

生成的图片如下：
在这里插入图片描述
本文是将这些图片转换为csv形式储存下来。

程序猿的冒险谭

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
一个字符训练材料生成的小文件

前几天想训练一个可以识别字符的模型，但是，苦于找不到训练材料，今天，做网站验证码时候发现了一个思路，写下来分享一下。from captcha.image import ImageCaptchaimport random,stringimport numpy as npcq=0str_1=""#这里我修改了一下源码源码width为160while cq<10: cq+=1 chr_all = string.ascii_letters + string.digits
复制链接

扫一扫