第三天:

对于数据集中的每个唯一船舶,我们在其出现的图像中手动绘制边界框,标记为船型,并为其指定使用单眼或AIS数据记录的名称。在极少数情况下,当我们无法识别船舶名称时,我们会根据其外观为其分配一个简短描述。因为图像被捕获为每秒一帧的图像序列,所以连续帧几乎是重复的,这不适合用于分类任务。为了避免重复相同的船舶实例,我们不会标记船舶出现的每个框架。每个船舶只有三到五个框架面向每个离散的45度方向。 45度的周期来自将360度旋转离散为8个方向,所有这些都是船舶可能面向的方向。离散化是在注释器的估计下完成的。在大多数情况下,只捕获了一个方向;少数,最多5到7个方向。这样,我们避免了数据集中的重复,但仍然包括尽可能多的任何给定实例的方向。例如,边界框图像如表1所示;示例对如图3所示。
从数据集中丢弃具有小于合理阈值(200像素)的区域的边界框。 由于给定的IR图像具有比其对应的RGB图像低得多的分辨率,因此较小或较远的对象可能仅满足RGB中的阈值。 丢弃小于阈值的边界框后,一部分成对的边界框图像仅留下RGB图像,没有其IR对应关系。我们将这些单例图像保存在数据集中。 晚上拍摄的所有RGB图像都被丢弃,使得所有夜间图像都成为IR单像。
数据统计:
该数据集由2865个图像(1623个可见光和1242个IR)组成,其中有1088个对应的对。 共有154个夜间红外图像。 该数据集包括264个独特命名的船舶,分为6个粗粒度类别(或15个细粒度类别):商船(26个货物实例,9个驳船实例),帆船(41个风帆,24个风帆),中型乘客 船(11艘渡轮,4艘游船),中型“其他”船(8艘渔船,14艘其他中型船),19艘拖船和36艘小船(28艘快艇,6艘水上摩托艇,25艘较小的乐趣,13艘较大的乐趣)。 可见边界框的面积范围为644-4478952像素,平均值为145833像素,中值为9983像素。 IR边界框的面积范围为594-137240像素,平均值为8544像素,中值为1610像素。
我们将数据集划分为“官方”训练和测试。因为我们对概括感兴趣,所以我们使用船舶的名称来确保每艘船都被分配到测试或训练集。数据集中的唯一实例数也按船名计算。为了创建训练和测试分裂,我们贪婪地将每个命名船舶的所有图像分配到任一分区,使得所有类别的每个分区中的图像数量大致相同。这导致539个图像对和334个单体用于训练,549个图像对和358个单体用于测试。将所有夜间图像分配给测试,这使我们能够测量仅在日间图像中学习对象表示时信息传输的情况。这很重要,因为夜间船舶交通量要低得多,因此标记数据更难以收集。所有类别都在夜间数据中表示。
用的CNN在ImageNet做过训练,

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值