YOLOv9来了，可编程梯度信息与广义高效层聚合网络助力全新检测SOTA前沿

最新推荐文章于 2025-01-21 11:30:55 发布

置顶

AIWalker-Happy

最新推荐文章于 2025-01-21 11:30:55 发布

阅读量1.9k

点赞数 39

分类专栏： YOLO 目标检测文章标签： YOLO 目标检测

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/huohu728/article/details/136279327

版权

本文首发：AIWalker
欢迎关注AIWalker，近距离接触底层视觉与基础AI技术

摘要

当今的深度学习方法侧重于如何设计最合适的目标函数，以便模型的预测结果最接近真实情况；与此同时，必须设计一个适当的架构，以便于获取足够的信息进行预测。现有的方法忽略了一个事实：当输入数据进行逐层特征提取和空间变换时，会丢失大量信息。本文将深入探讨数据通过深度网络传输时数据丢失的重要问题，即信息瓶颈和可逆功能。

提出了可编程梯度信息（PGI）的概念，以应对深度网络实现多重目标所需的各种变化。PGI可以为目标任务提供完整的输入信息来计算目标函数，从而获得可靠的梯度信息来更新网络权重。
设计了一种基于梯度路径规划的新型轻量级网络架构——广义高效层聚合网络（GELAN）。GELAN的架构证实了PGI在轻量化模型上取得了优异的成绩。我们在基于MS COCO数据集的目标检测上验证了所提出的GELAN和PGI。

结果表明，与基于深度卷积的现有方法相比，GELAN仅使用传统的卷积算子即可实现更好的参数利用。PGI可用于从轻量级到大型的各种型号。它可以用来获得完整的信息，使从头开始训练的模型比使用大数据集预训练的最先进的模型获得更好的结果，比较结果如图1所示。源代码位于：https://github.com/WongKinYiu/yolov9。

本文贡献

本文的贡献总结如下：

我们从可逆函数的角度对现有的深度神经网络架构进行了理论分析，通过这个过程，我们成功地解释了许多过去难以解释的现象。我们还基于该分析设计了PGI和辅助可逆分支，并取得了优异的效果。
我们设计的PGI解决了深度监督只能用于极深神经网络架构的问题，从而让新的轻量级架构真正应用到日常生活中。

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

AIWalker-Happy 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。