Depth Extraction from Video Using Non-parametric Sampling解读

本文介绍了使用非参数采样技术从视频中提取深度信息的方法,通过匹配数据库中的候选图像并利用SIFT Flow调整,实现单幅图片及视频的深度估计。这种方法依赖于数据库,适用于区域深度相似的场景,但对深度变化大或空中物体的估计有限。在2D转3D应用中展示了其潜力,尽管存在耗时和室外场景处理不足的问题。
摘要由CSDN通过智能技术生成

单幅图片的深度估计:给一副输入图像,在候选数据库中找到与它相近的候选项,将候选项调整后,利用候选项已有的深度信息对输入图像进行像素点的深度估计。这么做的原理就是在一个区域内相似的景象的深度也是相似的。

具体做法:首先需要数据库,这里作者用的数据库为作者自己采集的(http://kevinkarsch.com/depthtransfer)视频。有了数据库之后,就是在数据库搜索与输入图像最相近的候选项,这里作者选7个,7个分别来自不同的视频以保证视角的多样性。相似性度量用GIST和optical flow,度量方法采用KNN。有了与输入图像相似的图片之后,相似只是区域相似,如何调整到点相似,采用SIFT flow得弯曲函数y。最后,有了经过弯曲的候选图像,再用函数得到每幅输入图片L的逐个对应像素的深度值D。第一项代表深度估计值与7幅弯曲后的候选图片的深度值之间的差异,第二项代表估计深度的平滑度即梯度应尽量小(这里存在一个缺点,梯度尽量小就只能对输入图像时较平滑,深度变化不大的图像进行深度估计,当深度变化较大时不能对输入图像进行很好的估计),第三项当第一第二项所起作用不大时取数据库中对应像素点的平均深度值,第四项为归一化常数。


在视频中的应用与单幅图片的深度估计类似,只是在单幅图片之上添加了时域信息和运动物体的深度和它所在地面的深度两项

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值