只需2张照片就能2D变3D,这个AI能自己脑补蜡烛吹灭过程,一作二作均为华人 | CVPR 2022...

明敏 发自 凹非寺
量子位 | 公众号 QbitAI

2张废片啪地一合!

错过的精彩瞬间立刻重现,还能从2D升到3D效果。

看,小男孩可爱的笑容马上跃然浮现:

9cd624f354bc13e2f99bb276275d6206.gif

吹灭生日蛋糕蜡烛的瞬间也被还原了出来:

bdc1ad857ad618a5e3fc0c927b2c8518.gif

咧嘴笑起来的过程看着也太治愈了吧~

096b98cbb41274002bc0da60a17e5b66.gif

咱就是说,这回相机里熊孩子/毛孩子的废片终于有救了!

而且完全看不出是后期合成的效果,仿佛是原生拍摄的一般。

这就是谷歌、康奈尔大学、华盛顿大学最近联合推出的成果,能只用2张相近的照片还原出3D瞬间,目前已被CVPR 2022收录。

论文作者一作、二作均为华人,一作小姐姐本科毕业于浙江大学。

用2张照片正反向预测中间场景

这种方法适用于两张非常相似的照片,比如连拍时产生的一系列照片。

方法的关键在于将2张图片转换为一对基于特征的分层深度图像 (LDI),并通过场景流进行增强。

整个过程可以把两张照片分别看做是“起点”和“终点”,然后在这二者之间逐步预测出每一刻的变化。

具体来看,过程如下:

c1d235eb48568ae0f8e90092b1e172ce.png

首先,将两张照片用单应矩阵(homegraphy)对齐,分别预测两张照片的稠密深度图。

然后将每个RGBD图像转换为彩色的LDI,通过深度感知修复背景中被遮挡的部分。

其中,RGB图像即为普通RGB图像+深度图像。

d09264042ad6094d1ccd2308ced75fd7.png

之后用二维特征提取器修复LDI的每个颜色层,以获取特征层,从而生成两份特征图层。

下一步就到了模拟场景运动部分。

通过预测两个输入图像之间的深度和光流,就能计算出LDI中每个像素的场景流。

而如果想要两张图之间渲染出一个新的视图、并提升到3D,在此需要将两组带特征值的LDI提升到一对3D点云中,还要沿着场景流双向移动到中间的时间点。

然后再将三维的特征点投影展开,形成正向、反向的二维特征图及对应深度图。

最后将这些映射与时间线中对应时间点的权重线性混合,将结果传给图像合成网络,就能得到最后的效果了。

实验结果

从数据方面来看,该方法在所有误差指标上,均高于基线水平。

7d963b2a17135a7aff92f2888833c6ef.png

在UCSD数据集上,这一方法可以保留画面中的更多细节,如(d)所示。

744c8a8923fa8fddc1cb03bc357b5ab7.png

在NVIDIA数据集上进行消融实验表明,该方法在提高渲染质量上表现也很nice。

16a0e329efa512bc0d2f2a91030d506c.png

不过也存在一些问题:当两张图像之间的改变比较大时,会出现物体错位的现象。

比如下图中酒瓶的瓶嘴移动了,不该发生变化的酒杯也摇晃了起来。

762f0be2248798cd3fcb3cc4224a087f.gif

还有照片如果没有拍全的地方,在合成的时候难免会出现“截肢”的情况,比如下图中喂考拉的手。

c2e17989f1a60418ec7cb94ebdfcf30f.gif

团队介绍

97ec3e8c4116c8e212e91b957f0e984a.png

该研究的一作为Qianqian Wang,现在在康奈尔大学读博四。

她本科毕业于浙江大学,师从周晓巍。

研究兴趣为计算机视觉、计算机图形学和机器学习。

a54df16a8ec1c94832c86abffd61c677.png

二作是Zhengqi Li,博士毕业于康纳尔大学,本科毕业于明尼苏达大学,目前在Google Research。

曾获提名CVPR 2019最佳论文,谷歌2020博士奖研金,2020年Adobe Research奖学金,入围百度2021年AI华人新星百强榜单。

91e0cf0b8b12cc31eeb0a8f11e903b1c.png

参与此项研究的还有华盛顿大学教授Brian Curless

他还提出过另一种方法能够实现类似效果,同样只用到了2张照片,通过新型帧插值模型生成连贯的视频。

df2baa2ca31e08a38e7d36c89f24420e.gif

论文地址:
https://3d-moments.github.io/

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值