学习经验分享之二:YOLOX: Exceeding YOLO Series in 2021

论文地址: https://arxiv.org/pdf/2107.08430.pdf
代码地址:  https://github.com/Megvii-BaseDetection/YOLOXhttps://github.com/Megvii-BaseDetection/YOLOX

改进创新方法:可通过加cbam,se等注意力机制

YOLOX

YOLOX摘要
亮点:
1.采用anchor-free的方式
2.解耦头部
3.采用SimOTA
结果:
YOLONano为0.91M、1.08G Flops,超过NanoDet 1.8%AP
比YOLOv3高3%AP
相较于YOLOv4CSP、YOLOv5-L,速度为68.9FPS,超过YOLOv5-L 1.8%AP。
总结:主要是将anchor-free、SIMOTA、无NMS的检测器融入YOLO中。

YOLOx-DarkNet53
YOLOX是以YOLOv3-DarkNet53为基线进行的。(注意,这里的YOLOv3是加入了SPP的)
基线调整
同时adding EMA weights updating, cosine lr schedule, IoU loss and IoU-aware branch.
总结:
相较于YOLOv3-SPP做出了如下改动:
1.加入EMA权重更新
2.余弦lr调度
3.加入IoU损失
4.加入IoU感知分支

使用BCE损失,用于训练cls和obj分支,将IoU损失用于训练reg分支。
数据增强方面:
只进行RandomHorizontalFlip、ColorJitter和多尺度数据增强,并放弃RandomResizedCrop策略,因为我们发现RandomResizedCrop与计划的镶嵌增强有点重叠。
解耦头部
为解决分类和回归的冲突问题,提出使用解耦头部的方式。实验验证了耦合探测头会损害性能。
解耦头部的优点:
1.使用解耦的头部可以提高收敛速度。
2.解耦头部对于端对端的YOLO而言,必不可少。该结构组成:由一个1×1的卷积层减少通道数,后面跟着两个平行分支结构

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

人工智能算法研究院

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值