论文笔记-深度估计(4) Semi-Supervised Deep Learning for Monocular Depth Map Prediction

最新推荐文章于 2024-08-12 09:05:25 发布

一只飞鱼fy

最新推荐文章于 2024-08-12 09:05:25 发布

阅读量3.9k

点赞数 3

分类专栏：深度、位姿估计

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Kevin_cc98/article/details/78937773

版权

本文探讨了在深度估计中结合有监督和无监督学习的方法，特别是在CVPR2017的一篇论文中，作者提出在有限的有监督数据上结合无监督学习来预测深度图。通过使用Berhu函数减少深度残差误差，结合正则项来平滑深度变化并保持边缘不连续性，以及在网络结构中采用skip连接，提高了预测的准确性。研究发现，全面的无监督学习比仅在无标签区域学习效果更好，且Berhu函数在测试集上的表现优于L2损失函数。

摘要由CSDN通过智能技术生成

CVPR2017_Semi-Supervised Deep Learning for Monocular Depth Map Prediction

这是一篇用双目进行无监督学习估计深度的论文。

对一幅图进行有监督训练进行深度估计时，由于采集设备的局限，并非图像的每个像素都有对应的真实值。于是作者提出在图像有真实值的地方进行监督学习，无真实值的地方进行无监督学习（最终作者发现对整个图像都进行无监督学习+部分地方有监督学习效果最好）。这样的结合，使得无监督学习部分学习起来相对轻松甚至不需要很复杂的价值函数而不用担心陷入局部最优解，使得有监督学习速度能更快。

最后作者达到了state of art的效果。

1.介绍

作者认为当前有监督学习过程中过于依赖真实值，但真实值可能有以下问题：

有误差和噪音；
雷达等真值采集的测量值很稀疏；
需要对图像系统的内外参进行标定。
相机和雷达不能很好地对准，特别是两者中心无法很好对准，导致本来在相机视野之外的真值也投影到图片中

2.价值函数

整体流程如图：
这里写图片描述

相比前几篇论文，此处作者以预测逆深度为目标。我们知道，整个深度的分布由近及远是一个长尾分布，所以比起直接用深度Z，用反逆深度能更好地表达深度的数值特点。
作者总的价值函数包括有监督深度误差，无监督深度误差和正则化三个部分：

这里写图片描述

有时会感叹，双目匹配和深度估计在很长一段时间是高度相关的，深度估计也形成了形如双目匹配中 E=E

最低0.47元/天解锁文章

关注

3
点赞
踩
8

收藏

觉得还不错? 一键收藏
12
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 12

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。