Wang X, Xue G, Huang S, Liu Y. Underwater Object Detection Algorithm Based on Adding Channel and Spatial Fusion Attention Mechanism. Journal of Marine Science and Engineering. 2023; 11(6):1116. https://doi.org/10.3390/jmse11061116
Underwater Object Detection Algorithm Based on Adding Channel and Spatial Fusion Attention Mechanism
机翻:基于添加通道和空间融合注意力机制的水下目标检测算法
0 摘要
问题:由于水下环境复杂特殊,探测效果差,探测精度不高。
本文措施:yolov5作为目标检测算法的整体结构框架,同时进行了改进:
- 融合了通道注意力和空间注意力的注意力机制(Channel and Spatial Fusion Attention,CSFA),添加到yolov5网络框架中
实验结果:在数据集URPC实验检测精度(P)达到85%,召回率(R)达到82.2%,平均精度(mAP)达到87.5%。验证了所提方法的有效性,其水下目标检测性能优于普通模型。
1 引言
1.1 背景介绍
先说明海洋资源的重要性,而水下航行器是海底工作的主要手段,引出水下目标检测技术是自主水下航行器工作的基础和保障,最后,一个“然而”转折,点明水下图像的各种问题让研究更具挑战性。
1.2 综述
研究者关注图像处理,引出两种目标检测框架
->列举两阶段目标检测算法
->列举单阶段目标检测算法(SSD和yolo系列)
->注意力机制-在水下目标检测算法中加入通道注意力或空间注意力可以提高检测精度
->挑战:水下目标检测难,易漏检测、误检测等
解决:在yolov5中融合通道、空间注意力机制
2 改进
2.1 通道与空间融合注意力原理
- 不应该简单的串联并联,应该与跨纬度的信息进行交互。使用通道分割模块将输入特征通道平均分为两部分,分别用于通道注意力计算和空间注意力计算,最后使用concat模块将计算后的两个部分连接起来,使用通道洗牌模块进行信息交互。
- 利用群卷积,为了解决群卷积带来的副作用,提出通道洗牌来帮助通道间的信息流动。
2.2 yolov5改进
将CSP结构中的 Bottleneck 模块替换为注意力模块
SPP(空间金字塔池化)模块:使用 13 × 13、9 × 9 和 5 × 5 的池化来增加感受野
PANet基于FPN进行重复上采样和下采样,原有的加法操作改为连接
最后,使用三种不同尺度的锚框来限制预测对象的范围
3 模型分析
3.1 数据集
URPC,棘鹬、扇贝、海星和海星,6575张。7:3
在训练集中标记了 7899 只鸥鹬、1889 只扇贝、2922 只海星和 1768 只海星,共计 14,478 个目标物体。所有样品图像均使用Labelimg数据标签工具以PASAL VOC样品组格式进行标记,保存为xml文件,然后转换为yolo标签格式,保存为txt文件。
3.2 评估指标
精确率(P)、召回率(R)、平均精确度(AP)和平均平均精确度(mAP)
4 实验
a. 参数设置
b. 消融实验
c. 与其他模型比较
d. Grad-CAM 可视化
5 不足
由于水下环境复杂,数据采集难度较大,导致数据集的数量和质量略显不足。
未来工作:收集数据集并提高其质量上;水下图像增强与修复算法的研究