Automatic Pixelwise Object Labeling for Aerial Imagery Using Stacked U-Nets解读

本文提出了一种利用堆叠U-Net架构的流水线,用于自动化的航空影像物体标注,特别是在能源勘探等领域的应用。模型在Inria Aerial Image Labeling和Massachusetts Buildings数据集上表现出优越性能。通过处理下采样图像并上采样进行像素级标注,节省了计算资源,同时对分割质量影响甚微。实验表明,即使在低分辨率下,模型仍能保持高精度,提供显著的预测时间节省。
摘要由CSDN通过智能技术生成

 摘要 - 航空影像中物体标记的自动化是一项计算机视觉任务,具有许多实际应用。像能源勘探这样的领域需要一种自动化方法来每天处理连续的图像流。在本文中,我们提出了一个流水线来解决这个问题,使用一堆端到端的卷积神经网络(U-Net架构)。每个网络都可以工作后处理器到前一个。我们的模型在两个不同的数据集上胜过当前的最新技术:Inria Aerial Image Labeling数据集和Massachusetts Buildings数据集,每个数据集都具有不同的特征,如空间分辨率,物体形状和比例尺。此外,我们通过处理子采样图像并稍后向上采样按像素标记来实验验证计算时间节省。节省的这些资源对分割质量的影响可以忽略不计。虽然本文进行的实验仅涵盖航空影像,但所呈现的技术是通用的并且可以处理其他类型的影像的图像。

优点:

1利用了底层的特征(同分辨率级联)改善上采样的信息不足。

2在小数据集上也能train出一个好的模型

总体结构

将输入图像分成224x224x3像素的较小patch。这些pach是模型的输入,输出是裁剪预测mask。通过连接这些小的输出,我们可以得到全尺寸的预测</

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值