学习笔记--YOLOv10

南南东YaHo

已于 2024-06-17 20:03:34 修改

阅读量2k

点赞数 40

文章标签：学习笔记 YOLO

于 2024-06-17 15:58:12 首次发布

本文链接：https://blog.csdn.net/2303_76638998/article/details/139737907

版权

物体检测类型：

1.通用物体检测(yolo系列)
是检测数字图像中没有限制的物体实例，并从预设的分类中预测它们的类别属性。
2.显著物体检测(BBS-Net):
检测最为突出的物体，即人们总是先会关注那些更加吸引自己的目标。此任务的目标就是通过分析图像的视觉特征，来突出图像中与周围环境显著不同的目标。

传统方法和存在问题：

1.方法流程:
早期和后续的方法通常采用区域选择模块来提取区域特征并预测每个候选区域的激活概率
2.存在问题:
太多数将每个候选区域的识别分开处理，面对非典型和非理想的场合如(重度长尾数据分布和大量混乱类别)的时候会有表现的下降。

创新点一：面向大规模目标检测的空间感知图关系网络

如何在没有任何外部知说的情况下正确编码检测系统中的高阶目标关系?如何利用共现和对象位置之间的信息进行更好的推理?这营佰颜是大规慢目标检测系统而临的关键挑战，该系统着在说别当今数于个与复杂空间和语义关系纠塘在一起的物体，提炼可能影响对象说别的关键关系至关重要，因为在面对繁围的长尾数据分布和大量令人图照的类别时，单独处理每个区域会导致性旅大幅下降。最近的工作试照通过构建圈来编码关系，例如在班级之间使用手工语高知识或在区域之间隐式学习全连接图，然而，由于语言和规觉上下文之间的语义养距，手工语言知识无法针对每个图像进行个性化，而全连接堅通过整合来自不相关对象和背果的冗余和分散的关系/边缘而效率低下且墙杂。在这项工作中，我们引入了一个空间感知图关系网络(SGRN)来自适应发现和整合关键的语义和空间关系，以便对每个对象进行推理。我们的方法考虑了相对位置布局和交互，可以很容易地注入到任何检爱管道中以搬高性能，具体来说，我们的SGRN 集成了一个图学习器慢块，用于学习可互换的稀动逐结构以编码相关的上下文区域，以及一个具有可学习空间高斯极的空间超推理模块，以执行具有空间感的图推理，大量的实验验证了我们方法的有效性例如，在mAP方面，VG(3000类)提亮了约32%，ADE提亮了28%