随着计算能力的提升、可获取数据量的增加以及先进的算法的出现,人工智能技术迎来了它的又一次复兴。这次复兴主要以CNN在计算机视觉和RNN在自然语言处理领域的突破为特征。
目睹着CNN在计算机视觉各项任务(识别、检测、分割和超分辨等)取得的优良性能,包括作者在内的研究人员希望将这些算法用于SAR图像智能解译领域。此项研究的前提是要有用于训练和测试算法的数据集,这是目前所缺的,本文重点进行了介绍。
在以上计算机视觉任务中检测是最重要的,它起到承上启下的作用,是各项应用(人脸检测和识别、智能安防、智能医疗诊断和自动驾驶等)的关键技术,是最为活跃的研究领域。
作者近年来也重点对基于深度学习的SAR图像舰船目标检测技术进行了研究,本文重点介绍了用于训练和测试检测算法的数据集SSDD和SSDD+的构造过程及目标尺寸和长宽比分布情况,并对未来需要重点研究的内容进行了简单地总结。
SSDD
要想利用深度学习目标检测算法进行SAR图像舰船目标检测,必须有相应的数据集,但是目前本领域尚不存在此类数据集,因此建立了数据集SSDD[1]。SSDD是国内外公开的第一个专门用于SAR图像舰船目标检测的数据集,它可以用于训练和测试检测算法,使研究人员在同一个条件下对比算法性能。
它得到了三十几所高校和研究所的使用,需要数据的可以联系作者。对于每个舰船,检测算法预测舰船目标的边框,并给出是舰船目标的置信度。SSDD是借鉴PASCAL VOC数据集的制作过程来制作的,这是因为PASCAL VOC在目标检测领域应用较多,数据格式较规范,可以直接使用现有的算法在SSDD数据集上处理,对代码改动较小。
在数据集制作的过程中总结到,舰船检测数据集相比于识别数据集更容易制作,这是因为检测任务具有变换变性(识别任务具有变换不变性),即如果把同一个图像中的舰船目标进行移动或者尺度变化,就相当于新生成了一个训练样本。
同时检测数据集中只要有舰船即可,对舰船类别暂时没有要求。而识别的数据集需要收集各类舰船目标的大量的样本,难度较大。SSDD是通过在网上下载公开的SAR图像,并将目标区域裁剪成大小为500×500左右像素,并通过人工标注舰船目标位置而得的。
数据主要有RadarSat-2、TerraSAR-X和Sentinel-1传感器,HH、HV、VV和VH四种极化方式,分辨率为1m-15m,在大片海域和近岸地区都有舰船目标。表1是SSDD数据集中平均每幅图像舰船个数的统计信息。NoS是Number of Ships的缩写,NoI是Number of Images的缩写。