【常见20种验证码识别思路-yolox可以搞定大部分】

置顶 newxtc

于 2024-10-18 08:00:00 发布

阅读量3.1k

点赞数 40

分类专栏：验证码接口安全评测系列滑动验证码文章标签：机器学习 web安全人工智能安全网络安全

本文链接：https://blog.csdn.net/weixin_44549063/article/details/143022946

版权

验证码接口安全评测系列同时被 2 个专栏收录

227 篇文章

订阅专栏

滑动验证码

41 篇文章

订阅专栏

1.滑块验证码
方案1：ddddocr https://github.com/sml2h3/ddddocr
方案2：opencv（canny做边缘检测，在做模板匹配）
方案3：yolov8 （m l模型） https://github.com/ultralytics/ultralytics
1.某验的滑块验证码简单
在这里插入图片描述

2.某美的滑块验证码简单
有混淆的图标，但是大小不一，目标检测，大小差不多的就是目标图标
在这里插入图片描述

3.某盾的滑块验证码简单
简单，直接目标识别，或者图像匹配
在这里插入图片描述

4.某象的滑块验证码简单
有混淆图标，但是匹配图标的验证更深，作为特征匹配，yolo可以实现
在这里插入图片描述

2.文字点选验证码
方案：
yolo目标识别+分类网络（resnet50 101）+根据提供的文字顺序点击
1.某验的文字点选验证码简单
在这里插入图片描述

在这里插入图片描述

2.某盾的语序点选验证码适中
文字角度，颜色，抖动（特征明显）
在这里插入图片描述

3.某美的文字点选适中
字体只有角度旋转，颜色鲜艳，特征明显，可以生成样本自己训练
在这里插入图片描述

4.某象文字点选验证码适中
文字比较有个性，颜色不一，有重影，需要的样本数量会比较多
在这里插入图片描述

3.图标点选验证码
方案：
yolo目标识别+分类网络+根据提供的图标顺序点击（基本都是矢量图，特征明显）
1.某验的图标点选验证码简单
图标识别
在这里插入图片描述

2.某盾的图标点选验证码简单
图标是矢量图，三个定选项，2个多余的，有旋转，有白色的容易混淆
在这里插入图片描述

3.某美的图标点选适中
颜色鲜艳，图标数量对应，特征明显
在这里插入图片描述

4.某象图标点选验证码适中
矢量图是白色，没有旋转，拉伸，特征明显
在这里插入图片描述

4.语序点选验证码
方案：
目标识别+分类网络+固定句子（需要自己收集固定句子，做匹配）
1.某验的语序点选验证码难
语序点选，句子不固定，句子样本量会比较大
在这里插入图片描述

2.某盾的语序点选验证码适中
文字角度，颜色，抖动（都是四字成语）
在这里插入图片描述

3.某美的语序点选验证码适中
字体颜色鲜艳，只有角度，特征明显，四字成语
在这里插入图片描述

4.某象的语序点选验证码适中
字体颜色明显，有重影和角度，需要大量样本，都是四字成语
在这里插入图片描述

5.空间推理验证码
方案：
一个物体多属性的问题，首先yolo找到目标，根据区域大小，确定图像的大小属性和位置；然后需要把形状，朝向，颜色做分类网络的one-hot编码，得出物体的属性后；接着padddleocr识别提示词；最后在根据语义词性分割得到具体要做什么。
1.某验的空间推理验证码难
在这里插入图片描述

2.某盾空间推理难
有朝向，颜色，大小写，字母，数字，立方体
在这里插入图片描述

3.某美的空间推理验证码适中
没有重叠，颜色鲜艳，大小不一，特征明显，问题简单，逻辑推理简单
在这里插入图片描述

4.某象的空间语义验证码难
有二维图形，三维图形，大小写字母，语义简单（需要逻辑推理）
在这里插入图片描述

6.图像旋转
1.某象的旋转验证码适中
方案：
需要把旋转圆的外圈干扰绿色去掉，放大到原来的大小，旋转角度通过计算重合边缘的Sobel梯度来寻找最佳旋转角度
在这里插入图片描述

7.词序选词
方案：
有颜色，两个字组合，固定组合（需要数据量大），固定的四字语序。yolo目标检测，resnet50或者resnet101分类
1.某盾语序选词难
在这里插入图片描述

8.消消乐
1.某验的消消乐验证码适中
方案1：前提图像切割位置精确（每个图像分割出来都是一样的大小，位置相同），直接用md5计算图像的值来区分图像的类别。
方案2：怕图像切割位置不精确，直接用resnet18分类网络区分图像的类别。
在这里插入图片描述

9.五子棋
1.某验的五子棋验证码适中
棋盘的位置固定，区分各个棋子的颜色，判断四个棋子在一条线上，把另外的一个补上
方案1：前提图像切割位置精确（每个图像分割出来都是一样的大小，位置相同），直接用md5计算图像的值来区分颜色。
方案2：怕图像切割位置不精确，直接用resnet18分类网络区分颜色。
在这里插入图片描述

10.九宫格
方案：
对每个图片进行图像分类，然后选择同一类的3个图。需要大量样本，直接就是分类resnet101网络
1.某验的九宫格验证码高
在这里插入图片描述

2.yescaptcha 难
方案：
yolo （m，l，x）的目标检测可以检测8个类别中的6个，在单独训练剩下的人行道和楼梯基本就能完成任务
自行车（ok），摩托车（ok），公交车（ok），人行道，小轿车（ok），消防栓（ok），红绿灯（ok），楼梯（8个类别）
去除噪点，识别特定几个的物体，点击完了，在提交
在这里插入图片描述