[PaperReading]CF-YOLO

HenryFar

已于 2022-06-23 14:23:53 修改

阅读量1.7k

点赞数 1

分类专栏：论文阅读个人记录文章标签：计算机视觉目标检测图像处理神经网络深度学习

于 2022-06-23 14:20:03 首次发布

本文链接：https://blog.csdn.net/weixin_50850903/article/details/125426212

版权

4 篇文章

订阅专栏

3 篇文章

订阅专栏

该博客介绍了CF-YOLO，一种针对雪地条件设计的轻量级目标检测器，利用CrossFusion模块解决雪中物体检测难题。它结合了真实世界雪地数据集RSOD和峰值激活策略，优化了大型物体检测并提升了模型泛化能力。论文还探讨了特征融合方法和跨层次信息整合策略。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

CF-YOLO: Cross Fusion YOLO for Object Detection in Adverse Weather with a High-quality Real Snow Dataset

朋友圈看到的一篇文章，名字挺有趣，从arxiv下载来读读

从名字来看主要是读cross fusion部分，雪地场景数据集不必在意

现有的检测器难以学习在雪中检测的潜在信息。
建立了一个真是世界的雪地目标检测数据集（real-world snowy object detection dataset），命名为RSOD。
开发了一种具有独特激活功能的无监督训练策略，称为Peak Act，用来定量评估雪对每个物体的影响。
CF(Cross Fusion)是一个即插即用的特征聚合模块，集成了特征金字塔和路径聚合网络的优点。可以处理雪的模糊、失真、覆盖等不利检测问题——一开始我觉得在烟雾检测上兴许也适用，后来发现不是的，它不是检测雪，是检测雪中的物体，雪只是一种遮挡物来看的。

提出一个问题：建立真实的RSOD数据集和开发特征聚合模块来学习潜在信息的协同作用，真的可以增强雪地条件下前沿（cutting-edge）OD网络的能力吗？

To answer this question：

RSOD，用于检测真实的雪地目标。包含2100个真实世界的雪景图像，以COCO和YOLO格式进行注释。
引入积雪覆盖率（SCR）指标，定量评价积雪对物体的影响。
提出交叉融合模块（CF）。

CF块同时聚合了主干不同阶段的功能。通过直接融合这些特征，可以恢复高层特征中被破坏的对象的低层信息。

CF模块支持不同的输入输出阶段。
提出了一种轻量级目标检测网络CF-YOLO，将YOLOv5的neck部分替换为CF。不仅在实际雪地场景中具有良好的优化能力，而且具有有效的泛化能力。（数据集：RSOD+COCO）

A~C介绍了不同天气条件下目标检测的工作和基准数据集。

现有的特征融合工作包括FPN、PANet、NAS-FPN、BiFPN、ASFF等。

真实世界的雪地检测数据集

数据集，跳过。

在雪景图像中，一些大型的物体更有可能被YOLOv5遗漏。由于许多研究表明，检测模型在大型物体上的表现更好，所以对YOLOv5做了一个小调整，把检测置信度阈值设置为0.01。

YOLOv5已经检测到了大物体，但是置信度太低，无法通过非最大抑制（NMS）。原因是大雪会改变物体的轮廓、纹理和表面，遗漏和扭曲了低层视觉信息。
- 分析：不同大小的物体在不同的阶段进行预测，大物体在最后阶段进行预测，即大物体特征通过最深的网络之后，低层视觉信息被遗漏和失真，而这种无意义的信息会随着网络传播。在深层网络中，深层的感受野相对较大，因此，更深层可能会考虑更多无意义的特征，这可能会稀释有意义的特征，干扰网络从被雪覆盖的物体中提取有意义的特征，并降低预测的置信度。

(1). Cross Fusion交叉融合

CF块的提出，是为了解决上面的问题，它可以直接整合不同层次的特征。它可以缩短传播路径，当网络更深入时，减轻了有意义特征的稀释。

CF块使用gOctConv作为CF模块的融合组件。

如图，不同尺度的输入特征图同时送到CF层，直接到达低级特征。CF块还允许不同的in-out分支，即插即用。

CF可以提供更短的低层和高层特征之间的路径，CF的特征融合过程之一可以表示为：
formula

公式中的O₁为CF输出的上支，其他支路同理。

(2). CF-YOLO

用CF块代替YOLOv5的neck部分，从而提出CF-YOLO。如图：

cfyolo

CF-YOLO的结构非常灵活，可以通过更改CF(n)、进出阶段的数量以及gOctConv(K)的内核大小来修改它。在这篇论文中，堆叠了两层CF(n=2)。CF的核大小分别为1或3。