yolov7,v8还没捂热,yolov9就已经出来了。作为单阶段目标检测里面的佼佼者,yolo系列网络一直是被大家各种研究,各种改进、魔改,但是官方发布的yolo系列网络一直都是用于改进的框架基础,新年刚过,yolov9就悄悄的出来了。
yolov9论文题目:YOLOv9: Learning What You Want to Learn Using Programmable Gradient Information。
代码下载地址:https://github.com/WongKinYiu/yolov9.
v9的作者和v7,v4的作者都是同一人,在v9中,他提出了可编程梯度信息(PGI)和广义高效层聚合网络(GELAN)两个概念来提高网络的检测效果,并在MS COCO数据集的目标检测上验证了PGI和GELAN的可靠性,结果表明,与基于深度卷积的最新方法相比,GELAN仅使用常规卷积算子可以获得更好的参数利用率。PGI可用于从轻型到大型的各种模型。它可以用来获取完整的信息,使得从头开始训练的模型比使用大数据集预训练的最先进的模型获得更好的结果。实验对比结果如下图所示。
从图中我们也能看见,相对于过去的yolo系列网络以及其它的改进的yolo系列网络,在相对较低的参数下取得了更好的检测效果,这就从侧面反映出了PGI和GELAN的优势。
上图所示的是PGI和相关的网络体系及方法。分别是路径聚合网络(PAN)、可逆列(RevCol)、传统深度监督以及PGI。PGI主要由三个部分组成:(1)主分支:用于推理的架构;(2)辅助可逆分支:生成可靠的梯度,为主分支提供反向传输;(3)多级辅助信息:控制主分支学习可规划的多级语义信息。
上图所示的分别是CSPNet、ELAN和GELAN架构,其中GELAN是在模仿CSPNet后,将ELAN扩展为可支持任何计算块的GELAN。
上表所示的是v9系列网络与其它的实时目标检测器的比较结果,从表中可以看见,在COCO数据集上,v9系列网络的检测效率比其它的实时目标检测器的效果都要好,有了较大的提升。
ps:v4、v7、v9是同一作者,v5,v8是同一作者,且v5在v4后不久就出来了,v8在v7后不久出的,我们是不是可以期待下v10马上也要出来了。