摘要 - 航空影像中物体标记的自动化是一项计算机视觉任务,具有许多实际应用。像能源勘探这样的领域需要一种自动化方法来每天处理连续的图像流。在本文中,我们提出了一个流水线来解决这个问题,使用一堆端到端的卷积神经网络(U-Net架构)。每个网络都可以工作后处理器到前一个。我们的模型在两个不同的数据集上胜过当前的最新技术:Inria Aerial Image Labeling数据集和Massachusetts Buildings数据集,每个数据集都具有不同的特征,如空间分辨率,物体形状和比例尺。此外,我们通过处理子采样图像并稍后向上采样按像素标记来实验验证计算时间节省。节省的这些资源对分割质量的影响可以忽略不计。虽然本文进行的实验仅涵盖航空影像,但所呈现的技术是通用的并且可以处理其他类型的影像的图像。
优点:
1利用了底层的特征(同分辨率级联)改善上采样的信息不足。
2在小数据集上也能train出一个好的模型
总体结构
将输入图像分成224x224x3像素的较小patch。这些pach是模型的输入,输出是裁剪预测mask。通过连接这些小的输出,我们可以得到全尺寸的预测</