Depth Map Prediction from a Single Image using a Multi-Scale Deep Network

最新推荐文章于 2024-05-05 02:40:05 发布

quibbler123

最新推荐文章于 2024-05-05 02:40:05 发布

阅读量3.1k

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/quibbler123/article/details/51787296

版权

在这篇了论文中，我们提出了一种估计单张图片深度信息的新方法：使用神经网络对深度进行递归。分为两个步骤：首先估计出场景的整体结构，然后使用局部信息进行优化。这个网络使用。

3.1

模型结构

我们的网络由两个栈组成。如下图。

一个粗尺度网络首先在全局上对场景深度进行预测。然后通过使用细尺度网络进行局部区域的优化。两个部分都使用了原图像进行输入。但是粗尺度网络的输出，是通过细尺寸网络作为附加的第一层特征图像。通过这种方法，这个局部网络能编辑全局的预测，用来更好的和finer-scale details进行对应。

全局粗尺度网络

粗尺度网络的任务是使用场景的全局视角来预测整体深度图结构。网络的上几层是全连接层，因此可以包括整张图片的信息。同样的，底层和中间几层被设计通过最大池化操作降到一个小的空间维度，来连接图像不同部分。这样做了之后，这个网络能够整合整个场景全局的理解来预测深度。这样的针对全图的理解在单张图片中是需要的，因为这样可以有效地利用诸如消失点、物体位置、空间对齐等线索。局部线索（通常立体匹配）很难注意到这些重要的特征。

如上图所示，全局粗尺度网络包括了五个卷积、最大池化层，随后是两个全连接层。图中也描述了特征图和输出图的尺寸。最后的输出的尺寸是原图像素的1/4尺寸。相应的，一个中心的裁剪包括大多数的输入（我们待会儿会说到这个事情，我们在精细网络的第一层转化图像的时候，损失了图像边界的区域。）

注意输出的空间维数大于最高的卷积特征图。在通过网络预测之前，不是限制特征图尺寸的输出，而是依赖于硬编码上采样，我们允许顶层全连接层通过更

最低0.47元/天解锁文章

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
1
评论
Depth Map Prediction from a Single Image using a Multi-Scale Deep Network

在这篇了论文中，我们提出了一种估计单张图片深度信息的新方法：使用神经网络对深度进行递归。分为两个步骤：首先估计出场景的整体结构，然后使用局部信息进行优化。这个网络使用。3.1模型结构我们的网络由两个栈组成。如下图。一个粗尺度网络首先在全局上对场景深度进行预测。然后通过使用细尺度网络进行局部区域的优化。两个部分都使用了原图像进行输入。但是粗尺度网络的输出，是通过细尺寸网络作为附加
复制链接

扫一扫

quibbler123 CSDN认证博客专家 CSDN认证企业博客

码龄16年

2: 原创

79万+: 周排名

127万+: 总排名

5594: 访问

: 等级

77: 积分

3: 粉丝

1: 获赞

1: 评论

5: 收藏

私信

关注

热门文章

最新评论

Depth Map Prediction from a Single Image using a Multi-Scale Deep Network
torchzst: 你好，请问这个程序是怎么实现的呢，我下载了程序后，def perform(self, node,(input,), (output,)):一直报错，不知道怎么回事，望解答，万分感谢。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

Learning Depth from Single Monocular Images Using Deep Convolutional Neural Fields

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。