YOLOv9:学习你想学习使用可编程的梯度信息

文章介绍了YOLOv9的发布,提出可编程梯度信息(PGI)和广义高效层聚合网络(GELAN),在保持低参数量的情况下,实现优于深度卷积方法的检测效果。对比实验显示了PGI和GELAN在COCO数据集上的优势,以及YOLOv9系列在实时目标检测中的优越性能。
摘要由CSDN通过智能技术生成

yolov7,v8还没捂热,yolov9就已经出来了。作为单阶段目标检测里面的佼佼者,yolo系列网络一直是被大家各种研究,各种改进、魔改,但是官方发布的yolo系列网络一直都是用于改进的框架基础,新年刚过,yolov9就悄悄的出来了。

yolov9论文题目:YOLOv9: Learning What You Want to Learn Using Programmable Gradient Information。

代码下载地址:https://github.com/WongKinYiu/yolov9.

v9的作者和v7,v4的作者都是同一人,在v9中,他提出了可编程梯度信息(PGI)和广义高效层聚合网络(GELAN)两个概念来提高网络的检测效果,并在MS COCO数据集的目标检测上验证了PGI和GELAN的可靠性,结果表明,与基于深度卷积的最新方法相比,GELAN仅使用常规卷积算子可以获得更好的参数利用率。PGI可用于从轻型到大型的各种模型。它可以用来获取完整的信息,使得从头开始训练的模型比使用大数据集预训练的最先进的模型获得更好的结果。实验对比结果如下图所示。

从图中我们也能看见,相对于过去的yolo系列网络以及其它的改进的yolo系列网络,在相对较低的参数下取得了更好的检测效果,这就从侧面反映出了PGI和GELAN的优势。

上图所示的是PGI和相关的网络体系及方法。分别是路径聚合网络(PAN)、可逆列(RevCol)、传统深度监督以及PGI。PGI主要由三个部分组成:(1)主分支:用于推理的架构;(2)辅助可逆分支:生成可靠的梯度,为主分支提供反向传输;(3)多级辅助信息:控制主分支学习可规划的多级语义信息。

上图所示的分别是CSPNet、ELAN和GELAN架构,其中GELAN是在模仿CSPNet后,将ELAN扩展为可支持任何计算块的GELAN。

上表所示的是v9系列网络与其它的实时目标检测器的比较结果,从表中可以看见,在COCO数据集上,v9系列网络的检测效率比其它的实时目标检测器的效果都要好,有了较大的提升。

ps:v4、v7、v9是同一作者,v5,v8是同一作者,且v5在v4后不久就出来了,v8在v7后不久出的,我们是不是可以期待下v10马上也要出来了。

  • 9
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

爱改网络的法式小面包

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值