一、常用水下目标检测数据集
开源水下图像DUO[1]数据集包含7782张精确标记的图像,其中6671张用于训练,1111张用于测试。下图为DUO数据集的一些示例,数据集包括四种典型的水产养殖生物。DUO数据集中的图像呈现出色偏、低对比度、光照不均匀、模糊和高噪声等典型水下图像特点,为准确检测不同的水产养殖生物带来一定挑战,同时很大程度体现真实海洋环境检测目标面临的问题。
其次,在水下目标检测中常用的数据集还包括RUOD[2],RUOD数据集是一个广泛涵盖多种水下检测挑战的数据集,其中包括了丰富的目标类别标记,如:鱼、潜水员、海星、珊瑚、海龟、海胆、海参、扇贝、鱿鱼以及水母共十个类别。除了提供标准的训练集和测试集,RUOD数据集还设计了三个针对不同环境的测试集,即针对雾效应、色偏以及光干扰的测试集。这样的设计使得RUOD数据集能够从不同角度全面而地评估检测器的性能。
还包括URPC 系列水下目标检测数据集等等,这些多为水下生物2D目标检测常用数据集。近年来开源的还有包含深度信息的数据集。
二、YOLOv8
- YOLOv8是基于YOLO架构的一阶段目标检测SOTA模型,包括输入图像640和1280分辨率的目标检测网络模型。其网络结构通过改变通道宽度和网络深度提供了不同量级模型,用于满足不同任务的需求。
- 该模型骨干网络和Neck部分参考了YOLOv7 ELAN设计思想,采用了C2f结构,并删除了YOLOv5中对网络性能影响不大的结构块。
- 在模型的检测头部分采用解耦检测头,将分类分支和回归分支分离,同时也从Anchor-Based换成了Anchor-Free结构。
- 在损失函数计算部分采用了正样本分配策略(Task Aligned Assigner),并引入了 Distribution Focal Loss促进模型在训练过程中更好地收敛。
[1] Liu et al., ‘A Dataset and Benchmark of Underwater Object Detection for Robot Picking’, in 2021 IEEE International Conference on Multimedia & Expo Workshops (ICMEW), Shenzhen, China: IEEE, Jul. 2021, pp. 1–6. doi: 10.1109/ICMEW53276.2021.9455997.
[2] Fu et al., ‘Rethinking general underwater object detection: Datasets, challenges, and solutions’, Neurocomputing, vol. 517, pp. 243–256, Jan. 2023, doi: 10.1016/j.neucom.2022.10.039.