【目标检测】|PPYOLOE

在这里插入图片描述

首先PP-YOLOE-l 在COCO数据集上达到了51.4mAP。相比较PP-YOLOv2提升1.9AP和13.35%的速度,相比较YOLOX提升1.3AP和24.96%的速度。

而PP-YOLOE中主要的改进点是:anchor-free,powerful backbone and neck,TAL动态label assign,ET-head。

PP-YOLOE避免使用变形卷积[3,34]和matrixNMS[28]等操作符,以在各种硬件上得到很好的支持。

anchor free

作者使用PP-YOLOv2(49.1%mAP)作为baseline。作者认为,使用了anchor free之后,即使进行了一些精心设置,但是由于anchor base和anchor free赋值结果不一致,仍然带来了0.3%的AP降低。

而PPYOLOE中的anchor free方法,主要就是将之前anchor base中预测相较于anchor的xywh,改进为预测ltrb(left,top,right,bottom),并将ltrb结果乘上当前特征图的stride。

Backbone

密集连接聚合了具有不同感受野的中间特征,在目标检测任务中表现出良好的性能。

CSPNet【27】利用跨级密集连接来降低计算负担,同时又不损失精度,这在YOLOv5、YOLOX等有效对象检测器中很受欢迎。提出RepResBlock,它将剩余连接和密集连接相结合

主干名为CSPRepResNet,包含一个由三个卷积层和四个后续阶段组成的主干,由我们的RepResBlock堆叠,如图3(d)所示。在每个阶段中,采用跨阶段部分连接,避免了大量3×3卷积层带来的大量参数和计算负担.在这里插入图片描述

Efficient Task-aligned Head

为了解决分类任务与定位任务冲突的问题,YOLOX中采用了Decoupled head结构。但作者认为Decoupled head结构会使分类和定位任务分离独立,缺乏任务特异性学习,故提出了ET-head,ET-head可提升精度0.5mAP。

改进点:

①相比较TOOD,使用ESE block替换layer attention。

②分类分支添加了shortcut。

③回归分支使用distribution focal loss(DFL)。

④分类分支使用varifocal loss (VFL)。VFL使用目标分数来衡量正样本的损失。这种实现使得IoU较高的正样本对损失的贡献相对较大。这也使得模型在训练时更加关注高质量的样本,而不是那些低质量的样本。
在这里插入图片描述

label assign方式

作者使用的是TAL算法来进行正负样本分配,而TAL出自于论文TOOD中。TOOD中提出的TAL进一步解决了分类和定位分支不对齐的问题。
在这里插入图片描述

实验

在这里插入图片描述

ref
https://zhuanlan.zhihu.com/p/505992733

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值