第三天：

最新推荐文章于 2024-09-30 14:16:32 发布

Wenhui Liu

最新推荐文章于 2024-09-30 14:16:32 发布

阅读量393

点赞数

分类专栏：翻译

翻译专栏收录该内容

0 篇文章 0 订阅

订阅专栏

对于数据集中的每个唯一船舶，我们在其出现的图像中手动绘制边界框，标记为船型，并为其指定使用单眼或AIS数据记录的名称。在极少数情况下，当我们无法识别船舶名称时，我们会根据其外观为其分配一个简短描述。因为图像被捕获为每秒一帧的图像序列，所以连续帧几乎是重复的，这不适合用于分类任务。为了避免重复相同的船舶实例，我们不会标记船舶出现的每个框架。每个船舶只有三到五个框架面向每个离散的45度方向。 45度的周期来自将360度旋转离散为8个方向，所有这些都是船舶可能面向的方向。离散化是在注释器的估计下完成的。在大多数情况下，只捕获了一个方向;少数，最多5到7个方向。这样，我们避免了数据集中的重复，但仍然包括尽可能多的任何给定实例的方向。例如，边界框图像如表1所示;示例对如图3所示。
从数据集中丢弃具有小于合理阈值（200像素）的区域的边界框。由于给定的IR图像具有比其对应的RGB图像低得多的分辨率，因此较小或较远的对象可能仅满足RGB中的阈值。丢弃小于阈值的边界框后，一部分成对的边界框图像仅留下RGB图像，没有其IR对应关系。我们将这些单例图像保存在数据集中。晚上拍摄的所有RGB图像都被丢弃，使得所有夜间图像都成为IR单像。
数据统计：
该数据集由2865个图像（1623个可见光和1242个IR）组成，其中有1088个对应的对。共有154个夜间红外图像。 该数据集包括264个独特命名的船舶，分为6个粗粒度类别（或15个细粒度类别）：商船（26个货物实例，9个驳船实例），帆船（41个风帆，24个风帆），中型乘客船（11艘渡轮，4艘游船），中型“其他”船（8艘渔船，14艘其他中型船），19艘拖船和36艘小船（28艘快艇，6艘水上摩托艇，25艘较小的乐趣，13艘较大的乐趣）。可见边界框的面积范围为644-4478952像素，平均值为145833像素，中值为9983像素。 IR边界框的面积范围为594-137240像素，平均值为8544像素，中值为1610像素。
我们将数据集划分为“官方”训练和测试。因为我们对概括感兴趣，所以我们使用船舶的名称来确保每艘船都被分配到测试或训练集。数据集中的唯一实例数也按船名计算。为了创建训练和测试分裂，我们贪婪地将每个命名船舶的所有图像分配到任一分区，使得所有类别的每个分区中的图像数量大致相同。这导致539个图像对和334个单体用于训练，549个图像对和358个单体用于测试。将所有夜间图像分配给测试，这使我们能够测量仅在日间图像中学习对象表示时信息传输的情况。这很重要，因为夜间船舶交通量要低得多，因此标记数据更难以收集。所有类别都在夜间数据中表示。
用的ＣＮＮ在ImageNet做过训练，