Dispnet(双目立体匹配网络的开山鼻祖)

新嬉皮士

于 2022-10-24 00:08:09 发布

阅读量1.6k

点赞数

分类专栏：立体匹配网络文章标签：计算机视觉深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_39450134/article/details/127483300

版权

立体匹配网络专栏收录该内容

2 篇文章 1 订阅

订阅专栏

Dispnet是2016在cvpr提出的一篇很经典的论文，在谷歌学术上的引用已经超过1000+ 改论文提出了三个很经典的合成数据集并提出了一个卷积网络实现了实时的深度估计
论文链接: link

文章目录

一、主要贡献
二、网络结构
三、预测结果
四、总结

一、主要贡献

三个渲染数据集。总计35000张
1.FlyingThings3D 主要包括在日常中常见的物体在空间中用随机的3D轨迹摆放。作者针对这样的环境生成了25000张立体匹配的数据集并包含了对应的标签
在这里插入图片描述

2.Monkaa 数据集的第二部分是由开源的动画短片蒙卡制作而来。作者从短片的一些场景中挑选了一些场景来制作数据集。
3.Driving
这个数据集是三个数据集中最像真实自然环境下采集的图像。整个数据的分布是动态并且是从行驶车的角度拍摄的。有些图片效果和KITTI2015的图片效果比较接近。
在这里插入图片描述

二、网络结构

总体上作者借鉴了FlowNet中的提取特征部分和膨胀特征部分。作者在研究中发现在上采样的操作之间加入卷积会提高最后的效果(在KITTI 2015数据集上下降了15%的EPE)

在这里插入图片描述

三、预测结果

作者先用FlyingThings3d的数据集训练了dispnet网络然后再用kitti的数据集对网络进行了finetune 在当时的KITTI2015排行榜上位列第二名和第一名的差距很轻微，并且速度接近是第一名的1000倍。
在这里插入图片描述

四、总结

Dispnet的提出大大的推进了双目立体匹配的相关研究，论文中提出的合成数据集也成为了后续算法评估性能指标的benchmark。

关注

0
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
Dispnet(双目立体匹配网络的开山鼻祖)

基于深度学习的双目深度估计开拓性研究
复制链接

扫一扫

专栏目录

新嬉皮士 CSDN认证博客专家 CSDN认证企业博客

码龄7年

18: 原创

73万+: 周排名

133万+: 总排名

6万+: 访问

: 等级

324: 积分

6: 粉丝

119: 获赞

15: 评论

311: 收藏

私信

关注

热门文章

分类专栏

最新评论

人脸表情分类算法设计
新嬉皮士: 我也是在官网下载的，你可以再试一下
人脸表情分类算法设计
GOODNESS31: 打扰了博主，我想问下这个面孔库可以分享一下吗，我在官网上下载一直失败
python、pytorch中的常见的浅拷贝、深拷贝问题总结
蜗牛学ai: 最后的例子有点，正如下面的人评论，contiguous()后，会重新开辟内存空间来存储这个张量，是深拷贝，所以x改变，y不会改变，不论是父级改变还是子级改变
模拟人脸光照，阴影，遮挡的数据增强
CSDN-Ada助手: 多亏了你这篇博客, 解决了问题: https://ask.csdn.net/questions/8032201, 请多输出高质量博客, 帮助更多的人
python、pytorch中的常见的浅拷贝、深拷贝问题总结
I松风水月: 使用contiguous使得tensor连续化，会重新开辟一段内存空间来保存这个张量，所以是深拷贝了，作者最后一个例子有问题，x应该是不受影响的。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。