浙大团队发表 3D 视图合成新方法，效果远超 NeRF、NV-CSDN博客

本文链接：https://blog.csdn.net/HyperAI/article/details/112343160

By 超神经

内容提要：只需几个不同视角的视频，就能把整个人体形象 360° 无死角地构建起来，不得不说，AI 的脑补能力越来越强大。这样的工具，今后将可能为影视业、体育节目呈现等带来新的突破。

关键词：人体新视图合成动态 3D

未来，我们的看电影、球赛以及演唱会等的方式，可能被「自由视角视频」（free-viewpoint video）彻底改变。

你可能不知道什么是「自由视角视频」，但你应该体验过 VR、AR 视频，或者玩过 3D 游戏，这些都属于自由视角视频的范畴，其特点便是：可以从任意角度观看，提供完全沉浸式的观感。‍

观众可以切换任意视角，不再局限于导播镜头

这种视频到底怎么才能拍出来？一般来说，传统的方法是，需要好多台摄像机从不同角度一起拍，然后把所有角度的视频合成在一起。

比如这样，在各个角度布满摄像头获取多个角度的画面

最终合成为自由视角视频

但是这种方式依赖于多个摄像机，不仅成本昂贵，还受限于拍摄场地的环境。

还有一种方式，可以摆脱这些限制，只需输入少量角度拍摄的人体镜头，便可合成 360° 的人体 3D 新视图。这便是来自浙江大学的研究人员，最近发表的最新成果。

12 月底，该团队在 arxiv 上发表了新论文《Neural Body: Implicit Neural Representations with Structured Latent Codes for Novel View Synthesis of Dynamic Humans》，提出一种新的人体表示 Neural Body，用稀疏多视角视频进行动态 3D 人体新视图的合成。经过实验验证，该方法优于此前的其它方法。

Neural Body：用于动态人像新视图合成的结构化潜码隐式神经表征

论文地址：https://arxiv.org/pdf/2012.15838.pdf

值得一提的是，该论文背后的七位作者，均来就读或毕业于浙江大学，并来自浙江大学计算机辅助设计与图形学国家重点实验室。其中，Hujun Bao（鲍虎军）、Xiaowei Zhou（周晓巍）均为该实验室教授，Yinghao Xu（徐英豪）与 Qianqian Wang 本科毕业后，分别于港中文与康奈尔大学攻读博士学位。

素材不多，也能生成优质 3D 视图

目前，无论是影视节目，或是体育赛事，我们所看到的都是来自单个摄像头所拍摄的画面。如果能够得到「自由视角视频」，想看哪里看哪里，那一定会是上帝视角一般的体验。

事实上，AI 近几年也在研究这个问题，并诞生了诸如 NeRF、Neural Volumes （简称 NV）等视图合成方案。

不过，目前已有的研究表明，在密集的输入视图条件下，学习三维场景的隐式神经表示可以获得很好的视图合成质量。然而，如果视图是高度稀疏的，表示学习将是不适定的。