AI论文探讨室·A+·第101期-Neural Sparse Voxel Fields（神经稀疏体素化场）

最新推荐文章于 2024-11-14 01:32:59 发布

元宇宙MetaAI

最新推荐文章于 2024-11-14 01:32:59 发布

阅读量1.5k

点赞数 1

分类专栏：虚拟显示

本文链接：https://blog.csdn.net/CSS360/article/details/117485845

版权

虚拟显示专栏收录该内容

9 篇文章

订阅专栏

使用经典的计算机图形技术合成真实世界图像级视点图像是非常困难的，因为它捕获外观细节和几何模型是非常困难的。最近研究已经证明，可以通过学习场景表示，隐编码几何和外观不需要3D监督。
然而，存在的方法实际上存在模糊问题，由于有限的网络计算能力或者用场景几何较困难发现相机光线的精确交叉点。从这些表示中合成高分辨率图像常常需要耗时进行光线Marching。在本文工作，作者介绍神经稀疏体素场（NSVF），一个新的神经场景表示来快速和高质量的进行自由视点合成。NSVF定义了一组以稀疏体素八叉树形式组织的体素边界隐式场，以每个单元局部属性进行建模。作者进一步使用微分射线Marching方法，从一系列带位姿的RGB图像学习潜在的体素结构。使用稀疏体素八叉树结构，渲染新视角能够通过跳过体素中不包含相关场景内容来进行加速。作者优化后将比NeRF推理处理速度提升了10倍，实现高质量的结果。另外，通过利用一个隐稀疏体素表示，作者提出的方法能够容易应用到场景编辑和场景合成。作者也证明几个具有挑战的任务，包括多场景学习，移动人体的自由视点渲染，大尺度场景渲染。

作者针对的主要问题点：神经网络渲染合成的图像存在模糊、相机光线交叉点需要采用ray marching方式比较耗时、3D场景模型的编辑和重组；
作者用一个隐函数函数来代替对整个场景建模，NSVF由一组以体素为界的隐式场组成，这些隐式场组织在一个稀疏体素八叉树中。具体的，作者在体素的每个顶点指定一个体素嵌入，并通过相应体素的八个顶点聚集体素嵌入来获得体素内部查询点表示。进一步通过一个多层感知网络MLP来预测查询点的几何和外观。
在这里插入图片描述

作者的贡献：
（1）作者提出由一组以体素为界的隐式场表示的NSVF，其中每个体素被嵌入学习来编码局部属性以获得高质量的渲染；
（2）NSVF利用稀疏体素结构来实现有效渲染；
（3）作者介绍了一种提高训练的策略，能够用一个微分ray-marching操作有效学习潜在的稀疏体素结构，从一组带位姿的2D图像上端到端学习。
表面渲染
在这里插入图片描述
体渲染