简单验证码识别的python脚本

本文介绍了使用Python的PIL库进行简单验证码识别的方法,包括二值化处理、图片分割和特征向量识别。通过设置阈值进行二值化,然后计算像素点确定字符边界完成分割。识别阶段,先尝试通过竖直特征向量匹配模板,未成功时再用水平特征向量。在测试中,识别率达到了92%。
摘要由CSDN通过智能技术生成

最近在折腾验证码识别。最终的脚本的识别率在92%左右,9000张验证码大概能识别出八千三四百张左右。好吧,其实是验证码太简单。下面就是要识别的验证码。

0249
这里写图片描述

我主要用的是Python中的PIL库。

首先进行二值化处理。由于图片中的噪点颜色比较浅,所以可以设定一个阈值直接过滤掉。这里我设置的阈值是150,像素大于150的赋值为1,小于的赋为0.

def set_table(a):
    table = []          
    for i in range(256):
        if i < a:
            table.append(0)
        else:
            table.append(1)
    
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值