如何分类验证码UU云谈谈验证码识别
验证码是一种主要用于区分人类和计算机,达到阻止自动脚本反复提交垃圾数据的目的的技术。
验证码主要可以归类为如下三种:
图片验证码
语音验证码
智力测试答题验证码
图片验证码,网站方面随机生成一张图片,上面写着数字、字母或者汉字的组合,然后要求用户输入图片上的内容,并随表单一起提交。
攻破图片验证码的主要手段是OCR技术,在20年前,OCR技术尚是一大难题,但是现在已经有了成熟的解决方案,OCR技术主要是基于神经网络人工智能的相关研究成果实现。为了对付OCR技术,图片验证码有所升级,出现了杂点背景、扭曲文字等干扰机器识别的手段。对抗杂点背景的主要方法是通过颜色过滤杂点,还有就是缩OCR目标范围,比如限制在26个英文字母而不对特殊符号加以识别等;对付扭曲文字干扰的方法主要是对文字纹路矢量化,然后计算他们的基线并还原文字扭曲
语音验证码 ,常常作为图片验证码的补充,提供给有视觉障碍的人士使用。攻击的方法和图片验证码类似,音识别技术是对付它的法宝。当然不少语音验证码也使用了背景噪音等干扰,如何对付这种干扰又是另一个课题了。
智力测试验证码, 是验证码的另一种设计思路,这种验证码比较有趣,也比较难攻击。它的工作原理是由服务器随机抽取一个简单的常识性智力题给最终用户,然后让最终用户作答。比如在四张图片有三张风景,一张建筑物,然后让用户选出建筑物;再比如要求用户计算5+25等于多少,填写答案;还
验证码是一种主要用于区分人类和计算机,达到阻止自动脚本反复提交垃圾数据的目的的技术。
验证码主要可以归类为如下三种:
图片验证码
语音验证码
智力测试答题验证码
图片验证码,网站方面随机生成一张图片,上面写着数字、字母或者汉字的组合,然后要求用户输入图片上的内容,并随表单一起提交。
攻破图片验证码的主要手段是OCR技术,在20年前,OCR技术尚是一大难题,但是现在已经有了成熟的解决方案,OCR技术主要是基于神经网络人工智能的相关研究成果实现。为了对付OCR技术,图片验证码有所升级,出现了杂点背景、扭曲文字等干扰机器识别的手段。对抗杂点背景的主要方法是通过颜色过滤杂点,还有就是缩OCR目标范围,比如限制在26个英文字母而不对特殊符号加以识别等;对付扭曲文字干扰的方法主要是对文字纹路矢量化,然后计算他们的基线并还原文字扭曲
语音验证码 ,常常作为图片验证码的补充,提供给有视觉障碍的人士使用。攻击的方法和图片验证码类似,音识别技术是对付它的法宝。当然不少语音验证码也使用了背景噪音等干扰,如何对付这种干扰又是另一个课题了。
智力测试验证码, 是验证码的另一种设计思路,这种验证码比较有趣,也比较难攻击。它的工作原理是由服务器随机抽取一个简单的常识性智力题给最终用户,然后让最终用户作答。比如在四张图片有三张风景,一张建筑物,然后让用户选出建筑物;再比如要求用户计算5+25等于多少,填写答案;还