最强3D视图插值法?See360:通用、实时、逼真的全景视图插值

来源:3D视觉工坊

在公众号「3D视觉工坊」后台,回复「原论文」可获取论文pdf链接

添加微信:dddvision,备注:三维重建,拉你入群。文末附行业细分群

3dcfe2c546bba0011e16cf5285790eb3.jpeg

该研究提出了See360,一个用于360°全景视图插值的多功能且高效的框架。通过潜在空间视点估计,该框架利用多尺度仿射变换器(MSAT)实现了对新视图的渲染,支持粗到细的特征渲染。同时,引入条件潜空间自编码器(C-LAE)实现了任意角度的视图插值。该方法不仅适用于室内和室外真实及合成环境的数据集,而且在短时间内还能适应未知真实世界场景,展现出实时渲染的能力。See360模型的优越性能为以摄像机为中心的视图渲染和360°全景视图插值提供了有前景的发展方向。

9e3644b07fd796234b76ebf0cdc27526.png

读者理解:

这篇文章提出了一种新的全景视图插值框架,称为 See360。See360 的核心思想是将相机中心视角合成视为二维平移变换,并利用多尺度仿射变换器(Multi-Scale Affine Transformer)来实现粗到细的特征渲染。

  • See360 将相机中心视角合成视为二维平移变换,是一个很有创意的思路。这种思路简化了视图插值的复杂性,提高了计算效率。

  • See360 采用多尺度仿射变换器来实现粗到细的特征渲染,是一种很有效的方法。这种方法可以生成具有较高逼真度的视图。

  • See360 在多个数据集上的实验结果表明,其性能优于现有的方法。

我认为 See360 具有很强的应用潜力。随着人工智能技术的不断发展,See360 有望在虚拟现实、增强现实、三维重建等领域得到广泛应用。

7b89edae39b3f780ad39896790d3252d.png

1 引言

该研究旨在实现以摄像机为中心的360°全景新视图插值。通过利用显式的2D仿射变换在特征域中渲染参考视图,暗含地发现了参考视图之间的3D关联性。主要贡献包括多尺度仿射变换器(MSAT),以2D仿射变换渲染参考视图,实现高质量、逼真图像生成而无需3D信息。此外,引入了条件潜空间自编码器(C-LAE),允许用户以任意角度交互操作视图。提供了合成和真实数据集进行训练和测试,并在野外测试中表明See360能在一定程度上应用于未知真实场景。

386cd834b7cb07e4ebc88aebe9f24f74.png

2 方法

See360扩展了传统的生成对抗网络(GANs),引入了条件潜空间自编码器(C-LAE)以将3D相机姿态映射到2D图像投影。该方法涵盖了新型交叉补丁卷积和有效的条件角度编码。其核心思想是通过学习两个参考图像的等效2D仿射变换,融合这两个图像的3D相机姿态,从而生成视图是两个参考图像的加权插值。为了保证新视图的逼真质量,See360还引入了多尺度仿射变换器(MSAT),以粗到细的方式渲染边缘和纹理。整体而言,这个方法的主要目标是生成可以欺骗鉴别器的逼真视图。通过使用U形结构对特征图进行上下采样来进行特征提取和融合,结合条件角度编码和交叉补丁卷积对特征映射进行操作,实现了对目标相机姿态下的新视图生成。

7963ee39f38d42a544050e78ba05af47.png f95558463bf825b95a479c48b3e93a8e.png

3 总结

本文介绍了一项新颖的方法——See360,利用神经渲染技术从仅有的两幅重叠输入图像中生成不同观察角度的视图。该方法的核心在于将3D视图渲染转化为等效的2D仿射变换。作者提供了用于训练和评估的两种类型的数据集,分别包括合成和真实图像。See360模型在360◦视频处理中有潜在应用,并有望扩展到结合2D和3D信息进行高分辨率图像/视频渲染。

dd2bcb9423720535874b8e53ae907f9a.png 6a8bc7e2da43fdaab19145e1c7f44997.png

下载

在公众号「3D视觉工坊」后台,回复「 3dcv」,即可获取工业3D视觉、SLAM、自动驾驶、三维重建、事件相机、无人机等近千余篇最新顶会论文;巴塞罗那自治大学和慕尼黑工业大学3D视觉和视觉导航精品课件;相机标定、结构光、三维重建、SLAM,深度估计、模型部署、3D目标检测等学习资料。

3D视觉方向交流群成立啦

目前工坊已经建立了3D视觉方向多个社群,包括SLAM、工业3D视觉、自动驾驶、三维重建、无人机方向,细分群包括:

[工业3D视觉]相机标定、立体匹配、三维点云、结构光、机械臂抓取、缺陷检测、6D位姿估计、相位偏折术、Halcon、摄影测量、阵列相机、光度立体视觉等。

[SLAM]视觉SLAM、激光SLAM、语义SLAM、滤波算法、多传感器融合、多传感器标定、动态SLAM、MOT SLAM、NeRF SLAM、机器人导航等。

[自动驾驶]深度估计、Transformer、毫米波|激光雷达|视觉摄像头传感器、多传感器标定、多传感器融合、自动驾驶综合群等、3D目标检测、路径规划、轨迹预测、3D点云分割、模型部署、车道线检测、Occupancy、目标跟踪等。

[三维重建]NeRF、多视图几何、OpenMVS、MVSNet、colmap、纹理贴图等

[无人机]四旋翼建模、无人机飞控等

除了这些,还有求职、硬件选型、视觉产品落地、最新论文、3D视觉最新产品、3D视觉行业新闻等交流群

大家可以添加小助理微信:dddvisiona,备注:加群+方向+学校|公司, 小助理会拉你入群。

2fba6fce9d643fcbea6a5d0fb42e7175.png
添加小助理微信:dddvisiona,加群+方向+学校|公司,拉你入群

597d669b6e564fec4bbb190a177fab3b.jpegb2f7a798087874af1c386c402ab80fee.jpeg1c26583059d9870e501648f02cee1911.jpeg713e88de82591682127e1b1134e26355.jpeg

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值