开源多波束前视声呐目标识别数据集

cabinx

已于 2024-04-29 15:42:14 修改

阅读量7.4k

点赞数 27

文章标签：多波束前视声呐水下声学数据集目标识别

于 2022-12-05 17:32:59 首次发布

本文链接：https://blog.csdn.net/xiekaikaibing/article/details/128190265

版权

本项目介绍了一个多波束前视声呐目标识别数据集UATD，包含9200张声呐图像及10类目标的标注。旨在解决水下目标检测研究中的数据集稀缺问题，并推动该领域的技术发展。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

鉴于水下实验的高成本，高专业性，高复杂度的情况，开源水下数据集一直较为稀少。拥有数据的研究机构基本上也只限于自身使用。虎鲸开源计划致力于构建一个开放的实验平台，实验场地、硬件、软件、数据均在开源开放的范畴内。虎鲸开源计划期望能改善当前水下研究的条件，降低水下研究的门槛，促进水下研究的发展。

目前我们团队在虎鲸开源计划中开源了一个多波束前视声呐目标识别数据集UATD（Underwater Acoustic Target Detection）。数据集含10类目标，共9200张带标注的声呐图像。同时，数据集相关文章已发表于《Scientific Data》杂志，欢迎广大研究爱好者关注使用。另外不得不吐槽一下，杂志排版工作是印度团队做的，实在是太丑了，三哥真的不靠谱。我个人在arXiv上的版本链接我也会一并列出。文章doi如下：

A Dataset with Multibeam Forward-Looking Sonar for Underwater Object Detection | Scientific DataMultibeam forward-looking sonar (MFLS) plays an important role in underwater detection. There are several challenges to the research on underwater object detection with MFLS. Firstly, the research is lack of available dataset. Secondly, the sonar image, generally processed at pixel level and transformed to sector representation for the visual habits of human beings, is disadvantageous to the research in artificial intelligence (AI) areas. Towards these challenges, we present a novel dataset, the underwater acoustic target detection (UATD) dataset, consisting of over 9000 MFLS images captured using Tritech Gemini 1200ik sonar. Our dataset provides raw data of sonar images with annotation of 10 categories of target objects (cube, cylinder, tyres, etc). The data was collected from lake and shallow water. To verify the practicality of UATD, we apply the dataset to the state-of-the-art detectors and provide corresponding benchmarks for its accuracy and efficiency.https://doi.org/10.1038/s41597-022-01854-w

https://doi.org/10.48550/arXiv.2212.00352https://doi.org/10.48550/arXiv.2212.00352

在此简要说一下我们数据集的特色，详细情况还请直接阅读文章。

我们数据集最大的特色为提供前视声呐原始的回波强度数据。前视声呐输出的信息以距离和方位角为维度，为了满足人类的视觉习惯，厂商提供的前视声呐软件通常会对数据做一些处理，包括滤波和伪色彩等，最特殊的是输出图像是扇形处理后的。如下图：

处理后的声呐图像更方便人类操作员辨认目标，但滤波和伪色彩处理可能会导致部分数据丢失，扇形的图像在标注时可能会引入多余的信息（扇形区域外），这对于计算机目标识别算法的研究来说都是不友好的。

诚然，目前还是存在一些开源前视声呐数据集的，但这些数据集一来都是处理过的，二来数据集规模也较小，具体情况请参考文章。我们的数据与其它数据集数据对比如下图：

我们为历届全国水下机器人大赛（UPRC）线上赛目标识别赛声学赛道提供赛题数据。2022年的比赛地址如下：DC竞赛——领先的大数据与人工智能竞赛平台DataCastle（DC竞赛）是国内领先的大数据与人工智能竞赛平台，提供在线编程工具DCLab、数据集、开源分享和在线课程，积累20万数据科学领域用户。https://challenge.datacastle.cn/v3/cmptDetail.html?id=680

我们在大连金石滩和茂名好心湖等地采集了10类目标的数据，从中筛选质量较好的数据进行标注，最终选取9200张形成数据集。10类目标及其尺寸（m）如下图：

数据集分3个压缩文件："UATD_Training.zip", "UATD_Test_1.zip", "UATD_Test_2.zip"。每个压缩文件内有两个文件夹，image文件夹存声呐图像，annotation文件夹存标注文件。Trainning压缩文件内含7600对数据（图像加标注），其余两个压缩文件内含800对数据。

一对数据范例如下图所示：