验证码识别之二值化

最新推荐文章于 2023-11-21 15:33:13 发布

朱卫军.

最新推荐文章于 2023-11-21 15:33:13 发布

阅读量274

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/c98136202zig/article/details/103971038

版权

本文探讨了验证码识别中的二值化过程，解释了为何二值化能简化计算并提高效率。介绍了迭代法和最大类间方差法（OTSU）两种自动计算阈值的方法，以确定最佳的二值化临界点，从而提高验证码识别的准确性和效率。通过实例展示了这两种方法的效果。

摘要由CSDN通过智能技术生成

前言

二值化顾名思义就是将数变成两种值，一般非0即1。而在验证码处理中，如果直接使用灰度图，那么每个像素的值会在0-255，这样肯定会增加计算时间，而二值化后每个像素的值只是0和1。

在前面的简单验证码识别中，我的二值化代码是这样写的：a = (a > 180) * 255，至于这里为什么不乘1而乘255，因为我要显示图片看看效果。如果只是用于算法识别的话，乘1会更好。但是，这里的180也就是二值化的阈值是如何得到的，开始是通过一个一个试然后看效果哪个好就选哪个，因为我们一般只识别某个网站的验证码，这样只要测试几次得到结果后便可用于这个网站其他的验证码。

这样测试有点浪费时间，虽然是一次性的，但是你手动测出的验证码不一定是最合适的。所以我们需要算法去自动计算出验证码的阈值，算法有很多，这里我们使用迭代法和最大类间方差法，通过这两个算法计算出来的阈值基本差不多。

迭代法

求出图像中的最小灰度值和最大灰度值，分别记为Gmin和Gmax,则阈值初值T0=(Gmin+Gmax)/2;
根据阈值T0将图像分割成前景和背景两部分，求出两部分的平均灰度值m1和m2,平均灰度值=总灰度值/像素个数
求出新阈值T1=(m1+m2)/2
如果T0=T1，则结束，否则将T1的值赋予T0，从第2步重新计算。

算法实现如下：

import numpy as np
from PIL import Image

def itera

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。