YOLOX论文解读


论文: 《YOLOX: Exceeding YOLO Series in 2021》
代码: https://github.com/Megvii-BaseDetection/YOLOX

创新点

  1. 将YOLO检测器变为anchor-free形式,减少人工设置参数;
  2. 集成了其他先进检测技术(比如decoupled head、label assignment策略SimOTA)取得了SOTA性能;

与YOLO-Nano相比,AP提升1.8%;与YOLOv3相比,性能提升3%;
YOLOX-L,与YOLOv4和v5有相当参数量,在COCO数据集上达到50AP,在V100平台上达到68.9FPS;

算法

Decoupled head

为了解决分类分支与回归分支冲突问题,解耦两分支;
解耦头的作用如下:
1、加快拟合;
2、对end-to-end yolo(指无NMS后处理过程)性能影响比较大;如表1
在这里插入图片描述
具体解耦操作如下:如图2
1、使用 1 ∗ 1 1*1 11卷积降维到256;
2、增加两个并行分支,每个分支(分类、回归)使用两个3*3卷积;
3、在回归分支额外增加iou分支;
在这里插入图片描述

Strong data augmentation

数据增强主要采用Mosaic 和 MixUp;
mixup检测与分类原理相似;
1、对于尺度不一的输入,通过补0对齐,尺寸使得可以容纳下两张图;
2、相应的loss权重变为mixup参数lambd;

Anchor-free

Anchor-free可以减少设计的参数量及涉及的许多技巧(anchor聚类、Grid Sensitive)

Multi positives

为了与yolov3一致,anchor-free方案中也仅选择一个正样本(gt中心位置),同时忽略其他高质量预测框;
但是由于有些正样本也有正向作用,同时改善正负样本不均衡,因此作者将中心3*3区域作为正样本; 实验结果如表2,AP达到45,超越最好的YOLOv3基线44.3;
在这里插入图片描述

SimOTA

SimOTA过程如下:
1、计算成对预测框与真值框代价,如式1;
在这里插入图片描述
2、计算真值框与前k个预测框iou,其和为Dynamic k;因此对于不同真值框,其Dynamic k存在差异。
3、最后选择代价最小的前Dynamic k个预测框作为正样本;
SimOTA使得AP从45%提升至47.3%;相对于YOLOv3上,性能提升3%,见表2;

End-to-end YOLO

作者跟随参考文献39,增加两个卷积层,一对一分配标签,停止梯度回传,但是性能及推理速度出现下降,如表2。

实验结果

在这里插入图片描述

结论

作何提出一种高性能anchor-free检测器YOLOX,其在性能及速度上达到比较好的平衡;

  • 1
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值