文献阅读2：Underwater-YCC: Underwater Target Detection Optimization Algorithm Based on YOLOv7

本文链接：https://blog.csdn.net/Licil/article/details/135034121

Chen X, Yuan M, Yang Q, Yao H, Wang H. Underwater-YCC: Underwater Target Detection Optimization Algorithm Based on YOLOv7. Journal of Marine Science and Engineering. 2023; 11(5):995. https://doi.org/10.3390/jmse11050995

Underwater-YCC: Underwater Target Detection Optimization Algorithm Based on YOLOv7
机翻：Underwater-YCC：基于YOLOv7的水下目标检测优化算法

0 摘要

问题：水下图像模糊，颜色偏差，特别是对于小型目标
本文措施：基于yolov7的水下优化算法，以提高水下小目标的检测精度，具体改进：

利用卷积块注意力模块（CBAM），选择最优位置，获得细粒度语义信息
使用 Conv2Former 作为水下模糊图像网络的 Neck 组件
应用Wise-IoU，通过在高质量和低质量图像之间分配多个权重来有效地提高检测精度。

实验结果：在URPC2020数据集上实验，mAP 87.18%。

1 引言

1.1 背景介绍

说明海洋资源的重要性，而水下检测是资源开采和利用的关键步骤，引出水下目标检测研究，基于声学探测方法，又不足以探测小型水下生物，可能无法满足区分水下生物之前微小差异的需求。
“然而”转折，点明水下图像质量很差，说明了质量差的主要原因，传统的目标检测算法不适合复杂的水下环境。所以，引出基于深度学习的目标检测算法，可分为两大类，第一种是两阶段算法，推理速度缓慢，进而开始说明单阶段目标检测算法（综述）

1.2 综述

采用一级检测算法，直接在图像上完成目标定位和回归。
->OverFeat是最早开发的单极探测器之一
->YOLO系列，研究者的各种改进（yolov5）

基于YOLOv4-tiny的改进算法，在Neck引入FPN
yolov5中有增加CBAM模块，以节省参数和算术能力
利用SAGHS恢复了水下图像，获得了适用于被遮挡水下目标的探测模型

->证明了基于YOLO的算法在水下目标检测方面的潜力，以及针对特定应用优化网络架构和训练策略的重要性。
->提出基于yolov7的优化算法，列出了创新点。

数据增强
yolov7：引入CBAM注意力机制
引入Conv2Former作为网络的Neck组件
引入Wise-IoU作为边界框回归损失函数

2 相关工作

2.1 数据集

URPC2020数据集由 5543 张图像组成，分为四类：棘鹬、全鳃、扇贝和海星。
8：2

2.2 数据增强

提高模型泛化能力

几何变换，翻转、旋转、移位、缩放、裁剪
混合数据增强，从每批中随机选择两张照片，并按一定比例进行混合，生成新图像

λ∈[0,1]∈0,1.
Mosaic数据增强，在数据集中混合和剪切四个随机选择的图像以获得新图像

2.3 注意力机制

为了提取更全面的语义信息，增强模型的特征提取能力，将CBAM注意力机制（信道注意力模块与空间注意力模块相结合）分别引入yolov7架构中的Backbone、Neck和Head结构中，以确定注意力机制的最有效位置。

2.4 yolov7

->介绍了yolov7的架构（将 YOLOv7 的结构分为 Backbone 和 Head 两部分。我们将中间特征融合层划分为Neck，以方便检测注意力机制对不同位置检测结果的影响。）
->再重点分段介绍骨干，颈部和头部

3 水下-YCC算法

3.1 带有 CBAM 的 YOLOv7

在yolov7中的Backbone、Neck 和 Head 三个模块中加入了注意力机制

3.2 基于 Conv2Former 的颈部改进

->transformer的重要性，Conv2Former是利用卷积对空间特征进行编码的最有效方法之一。
->介绍了Conv2Former。它是一个Transformer式的卷积网络，具有金字塔结构，四个阶段中每个阶段都有不同数量的卷积块。
->Conv2Former 取代了原始 YOLOv7 Neck 中的 ELAN-F 卷积块。