python的Tesseract-OCR-04-识别，使用jTessBoxEditor 提高数字验证码识别准确率

最新推荐文章于 2024-05-31 11:01:21 发布

大Q熊猫

最新推荐文章于 2024-05-31 11:01:21 发布

阅读量1.8k

点赞数 8

文章标签： python

本文链接：https://blog.csdn.net/weixin_46874767/article/details/112369391

版权

python的Tesseract-OCR-04-识别，使用jTessBoxEditor 提高数字验证码识别准确率

文章目录

前言
一、训练图库的生成
二、数字验证码识别
三、识别数字验证码
四、总结

前言

第二次写博文了，也可以说是自己的学习笔记，希望对你们也有帮助，有问题有错误，欢迎指正，我都会一一更正，谢谢各位。
文章可能会稍微比较长，我会分成三个部分来介绍：训练图库的生成、训练图库、数字验证码的识别。

一、训练图库的生成

首先就是批量生成数字验证码这部分的操作以及代码的实现我都在我的另一个文章中写了，我就不过多赘述了，下面的链接就是了。
https://blog.csdn.net/weixin_46874767/article/details/111406957

1.生成训练图库

因为有之前的代码作为基础，所以可以接着之前已经编写过的代码直接生成批量的训练图像，因为数字验证码都带有噪点和噪线，所以需要进行形态学操作，将噪点和噪线去除掉。

代码最好是结合之前自动生成数字验证码一起来看，我这里就不贴出完整的代码，如果想要完整的代码可以直接在评论区那里说一下，也可以直接找我，
代码如下（示例）：

    # 读取图像以及二值化
    image = cv.imread(r'G:\image1\noise_verification code\%s.png' %name, cv.IMREAD_GRAYSCALE)
    ret, binary = cv.threshold(image, 225, 255, cv.THRESH_BINARY_INV)
    
	#形态学操作
    kernel = cv.getStructuringElement(cv.MORPH_RECT, (2, 2))
    bin1 = cv.morphologyEx(binary, cv.MORPH_OPEN, kernel)
    # cv.imshow('image1', bin1)
    kernel = cv.getStructuringElement(cv.MORPH_RECT, (2, 2))
    bin2 = cv.morphologyEx(bin1, cv.MORPH_CLOSE, kernel)
    # cv.imshow('image2', bin2)

    cv.waitKey(0)
    cv.bitwise_not(bin2, bin2)
    #保存图像
    cv

最低0.47元/天解锁文章

大Q熊猫

关注

8
点赞
踩
10

收藏

觉得还不错? 一键收藏
8
评论
python的Tesseract-OCR-04-识别，使用jTessBoxEditor 提高数字验证码识别准确率

python的Tesseract-OCR-04-识别，使用jTessBoxEditor 提高数字验证码识别准确率文章目录前言一、训练图库的生成1.生成训练图库2.图像读取以及二值化3.形态学操作4.保存图像以及批量生成二、数字验证码识别1.安装训练工具2.获取训练图库3.Merge样本文件4.生成BOX文件5.字符配置文件6.编辑字符7.执行批处理文件7.移动num.traineddata文件三、识别数字验证码四、总结前言第二次写博文了，也可以说是自己的学习笔记，希望对你们也有帮助，有问题有错误，
复制链接

扫一扫