验证码识别浅谈

一、验证码的基本知识

  
  验证码的主要目的是强制人机交互来抵御机器自动化攻击的。大部分的验证码设计者并不得要领,不了解图像处理,机器视觉,模式识别,人工智能的基本概念。

  设计的比较好的验证码,比如Yahoo,Google,Microsoft等很难识别。而国内Tencent的中文验证码虽然难,但算不上好。

 

      某些专家认为,不存在一种用计算机表示的信息不能被计算机识别的情况,所以,对验证码来说,所有验证码都是可以识别出来的。

 

二、验证码识别处理基本知识

 

人工智能,模式识别,机器视觉,图像处理的基本知识
 

1)主要流程:

 

  1.读取验证码图像:把各种验证码图像解码,得到平面坐标表示的数据,很多开源库可以用来做这一步。

  2.前处理:验证码识别的预处理主要是去除图像上的干扰,找出字符区域。对于连接在一起的字符,进行分割。对于复杂的验证码,分割这一步非常难处理。对于单个字符,OCR技术的识别率还是能达到比较高的。

  3.训练:对于模式识别,主要是对样本进行特征提取,然后保存下来。不是训练的样本越多越好。过学习,泛化能力差的问题可能在这里出现。这一步不是必须的,有些识别算法是不需要训练的。

  4.识别:对于模式识别来说,主要是验证码字符与训练的样本的特征匹配。
 

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值