YOLOX论文阅读

因为打比赛的需要用到YOLOX算法,专门看了一下YOLOX的论文,做个阅读笔记。

论文链接:https://arxiv.org/abs/2107.08430

YOLOX在YOLO V3的基础之上,加了很多新的方法,特别是使用anchor-free代替了anchor-base,既降低了参数有提升了性能。下面一个一个进行讲解。

Decoupled head

YOLO系列为了简便,使用一个卷积头(coupled head)同时预测cls、reg以及obj,现在已有多种多篇论文证明卷积解耦结构能够提升模型性能,因此在这里使用卷积解耦的方式进行预测,具体的,使用一个分支预测cls,另一个分支预测reg以及obj。

 性能提升情况:

 性能提升情况:

 

Strong data augmentation

数据增强能够有效提升模型性能,YOLOX使用了mosaic、mix up作为额外的数据增强。值得注意的是,在训练的最后15个epoch,YOLOX停止了这些这些strong data augmentation。

有两点值得注意:

1、在使用这些数据增强后,使用ImageNet的预训练不能带来性能的提升,因此后续都是从头开始训练模型

2、在训练小模型YOLOX-Nano是,发现使用去除mix up以及减少mosaic的尺寸范围,能够更好的训练模型,这可能与模型的学习能力有关。

Anchor-free

原始的YOLO V3使用anchor-base,但是anchor-base存在着一些问题,首先anchor设置问题,使用聚类等方法得到anchor缺少泛化性能,其次,anchor增加了大大增加了计算量。

因此YOLOX使用anchor-free的方式,YOLOX在FCOS的基础上进行改进,对于location,YOLOX预测相较于grid的左上角的偏移量以及预测的长宽。

Multi positives

FCOS对每个物体只输出一个正样本,而YOLOX将中心区域的3x3作为正样本,也就是center sample,这可以显著提升性能。

SimOTA

重点的重点,还没有看过论文,等看完论文之后再写一篇补上。

消融实验

总的来说,YOLOX并没有给我一种特别惊艳的感觉,与YOLO V4、YOLO V5,只是在YOLO V3的基础上,将多种trick以及验证有效的方法进行拼接。不过这也彰显了YOLO系列的系列的伟大。 

 

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值