[yolov9]将yolov9封装成类几句代码实现目标检测任务

FL1623863129

已于 2024-02-23 20:53:35 修改

阅读量1.7k

点赞数 23

分类专栏：深度学习文章标签：目标检测人工智能计算机视觉

于 2024-02-23 20:52:10 首次发布

本文链接：https://blog.csdn.net/FL1623863129/article/details/136263437

版权

深度学习专栏收录该内容

115 篇文章 17 订阅

订阅专栏

【框架地址】

https://github.com/WongKinYiu/yolov9

【yolov9简介】

YOLOv7原作者出手，YOLOv9的性能依旧时一枝独秀：

YOLOv9架构图

YOLOv9的整体架构图如下（根据YOLOv9.yaml绘制）：

YOLOv9改进点一览

YOLOv9从可逆函数角度理论上分析了现有的CNN架构，基于这种分析，YOLOv9作者还设计了PGI和辅助可逆分支，并取得了优秀的结果；
YOLOv9用到的PGI解决了深度监督只能用于极深的神经网络架构的问题，因此使得新的轻量级架构才更适合落地；
YOLOv9中设计的GELAN仅使用传统卷积，就能实现比基于最先进技术的深度可分卷积设计更高的参数使用率，同时展现出轻量级、快速和精确的巨大优势；
基于所提出的PGI和GELAN，YOLOv9在MS COCO数据集上的性能在所有方面都大大超过了现有的实时目标检测器。

PGI（可编程梯度信息）组件

PGI主要包括三个组成部分，即：

主分支
辅助可逆分支
多级辅助信息

从图中可以看出，PGI推理过程仅使用主分支，因此不需要任何额外的推理成本。

GELAN模块

YOLOv9提出了新网络架构——GELAN。GELAN通过结合两种神经网络架构，即结合用梯度路径规划（CSPNet）和（ELAN）设计了一种广义的高效层聚合网络（GELAN）；GELAN综合考虑了轻量级、推理速度和准确度。

GELAN整体架构如上图所示。YOLOv9将ELAN的能力进行了泛化，原始ELAN仅使用卷积层的堆叠，而GELAN可以使用任何计算块作为基础Module。

损失函数与样本匹配

通过上图代码可以看到，样本匹配依旧使用的是TaskAlign样本匹配。和YOLOv8、YOLOE、YOLOv6等算法保持一致；

分类损失：BCE Loss 回归损失：DFL Loss + CIoU Loss

速度&精度对比

可以看出，YOLOv9的性能最为优秀，应该会成为2D检测的新宠。

【视频演示】

https://www.bilibili.com/video/BV1AF4m1E7G1/?vd_source=989ae2b903ea1b5acebbe2c4c4a635ee

【实现代码】

from Yolov9Manager import *

detectcor = Yolov9Mangager(weights='weights/yolov9-c.pt',confidence=0.5)
# img = cv2.imread(r'E:\person.jpg')
# result_list = detectcor.inference_image(img)
# result_img = detectcor.draw_image(result_list, img)
# cv2.imshow('result', img)
# cv2.waitKey(0)
# cv2.destroyAllWindows()
detectcor.start_video(r'D:\car.mp4')

【参考文献】

[1] https://mp.weixin.qq.com/s/31NlBknx4PcXipfuV2w6hw