python的Tesseract-OCR-04-识别,使用jTessBoxEditor 提高数字验证码识别准确率

python的Tesseract-OCR-04-识别,使用jTessBoxEditor 提高数字验证码识别准确率



前言

第二次写博文了,也可以说是自己的学习笔记,希望对你们也有帮助,有问题有错误,欢迎指正,我都会一一更正,谢谢各位。
文章可能会稍微比较长,我会分成三个部分来介绍:训练图库的生成、训练图库、数字验证码的识别。

一、训练图库的生成

首先就是批量生成数字验证码这部分的操作以及代码的实现我都在我的另一个文章中写了,我就不过多赘述了,下面的链接就是了。
https://blog.csdn.net/weixin_46874767/article/details/111406957

1.生成训练图库

因为有之前的代码作为基础,所以可以接着之前已经编写过的代码直接生成批量的训练图像,因为数字验证码都带有噪点和噪线,所以需要进行形态学操作,将噪点和噪线去除掉。

代码最好是结合之前自动生成数字验证码一起来看,我这里就不贴出完整的代码,如果想要完整的代码可以直接在评论区那里说一下,也可以直接找我,
代码如下(示例):

    # 读取图像以及二值化
    image = cv.imread(r'G:\image1\noise_verification code\%s.png' %name, cv.IMREAD_GRAYSCALE)
    ret, binary = cv.threshold(image, 225, 255, cv.THRESH_BINARY_INV)
    
	#形态学操作
    kernel = cv.getStructuringElement(cv.MORPH_RECT, (2, 2))
    bin1 = cv.morphologyEx(binary, cv.MORPH_OPEN, kernel)
    # cv.imshow('image1', bin1)
    kernel = cv.getStructuringElement(cv.MORPH_RECT, (2, 2))
    bin2 = cv.morphologyEx(bin1, cv.MORPH_CLOSE, kernel)
    # cv.imshow('image2', bin2)

    cv.waitKey(0)
    cv.bitwise_not(bin2, bin2)
    #保存图像
    cv
  • 8
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 8
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值