拉普拉斯金字塔神经网络(LAPNet)

1.任务即网络简介

计算机视觉任务对于给定单张图像对图像上的每个像素都要预测一个连续的值(稠密的连续数值回归DCR任务)

它的问题即技术难点在于像素级的回归精度不够,在受到拉普拉斯金字塔对重建高质量信号的启发,面向复杂场景下的多尺度结构结构表达,设计了拉普拉斯金字塔神经网络(LAPNet),包含一个拉普拉斯金字塔解码器用于场景结构重建和一个自适应的稠密特征融合模块去融合从输入图像中提取到的多尺度特征。具体的其构建了拉普拉斯金字塔解码器来有效地表达全局和局部场景结构。在拉普拉斯金字塔解码器中,上层低层分别表达了场景地总体布局和物体局部细节,在此设计一个残差细化模块去逐层级补充高频结构细节;为了恢复金字塔每层结构提出了自适应稠密融合模块,以自适应融合多尺度图像特征

论文来源:https://ieeexplore.ieee.org/document/9286884

2.创新点

(1) 针对单视角图像的稠密连续数值回归(DCR)任务提出了一个通用拉普拉斯金字塔网络LAPNet,设计了拉普拉斯金字塔解码器(LPD)来恢复复杂场景的多尺度结构,利用残差细化模块来有效整合相邻频段的信号。

(2) 为了更好的预测拉普拉斯金字塔解码器中不同频段的残差信号,设计了稠密特征融合模块来自适应地融合输入图像的多尺度特征。

(3) 所提LAPNet模型具有较强的通用性,可以被直接应用于各种不同的稠密数值回归任务,实验证明,我们的LAPNet在代表性的DCR任务(室内及室外场景单视角深度估计,遥感图像高度估计以及人群密度估计)中都取得了最优的性能,在视觉上可以恢复出复杂场景的精细结构。

3.网络结构

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值