论文解读:利用结构隐代码的隐神经表示方法来合成动态人体的新颖视角

9596859065907ee59e3b7cef79844eee.png

758b4e82ad9ac99f1c05e4f51b2d512d.png

从稀疏多视点视频合成表演者新颖视角图像。数据输入是通过同步的RGB相机捕获的表演者视频。体神经捕获表演者的3D几何和外表,用来进行3D重建和新颖视角合成。

01 摘要

本论文主要解决在稀疏排列相机情况下,捕捉人体来合成新颖视角图像。一些最近的工作在稠密的输入视角下利用3D场景隐神经表达方法,可以合成效果较好的视角图像。然而,当视角较为稀疏情况下,学习效果较差。为解决这个错乱问题,作者在视频帧上整合观察结果。最后,作者提出了NeuralBody,一个新的人体表示方法。该方法假设不同帧上学习到的神经表示共享,锚定到一个可变网格的隐代码集上,以便跨帧观察能够自然集成。这个形变网格也提供几何来指导网络去学习更有效的3D表示。代码和数据集地址https://zju3dv.github.io/neuralbody/

02 方法

67d9673387c3f2a351f37d2ac5012601.png

使用结构隐代码的隐表示流程图。(a)结构隐代码输入到SparseConvNet,能够输出一个隐代码体。这个过程将定义在曲面上的输入代码扩散到三维空间。(b)对任意3D点,它的隐代码通过隐代码体上临近的顶点三线性差值获得,并通过MLP网络进行透明度和颜色回归。

体神经

给定一个表演者稀疏多视角的视频,生成表演者自由视点视频。首先需要对相机进行预标定,然后对每张图像获得人体前景mask,背景图像像素设置为0。本论文提出的模型流程总共包含四部分:附着在形变人体模型表面的结构隐代码集;在表面周围任意位置的隐代码能够通过 代码扩散处理 获得;通过神经网络解码出稠密度和颜色值;通过体神经渲染方式获得任意视点的图像。

结构隐代码

为了控制隐代码的空间位置,作者将这些隐代码锚定到一个形变人体模型SMPL。SMPL函数输出一个由6890顶点组成的网格。评估每帧多视角图像下的SMPL参数,隐代码的空间位置使用估计参数进行变换,来做稠密度和颜色回归。

代码扩散

隐场分配稠密度和颜色到3D空间中的每个点,在连续3D位置查询隐代码。这个可以通过三线性插值实现。然而,因为结构隐代码在3D空间中是稀疏的,直接插值隐代码将会导致大部分3D点为零向量。为解决这个问题,作者将定义在表面的隐代码扩散到附近3D空间中。

作者选择SparseConvNet来有效处理结构隐代码,并输出一个隐代码体。因为代码扩散不应该受人在世界坐标系的位置和方向影响,作者转化代码位置到SMPL坐标系统下。代码扩散也将结构隐代码的全局和局部特征统一考虑,帮助作者学习隐场。3D空间点x的隐代码为:

3476189539f44dd241b3a722208e38aa.png

透明度和颜色回归

使用一个4层的多层感知机进行预测 透明度

2da43eedffad73d7ac5c0fbf93c74c7b.png

所有的隐代码和视角方向d作为颜色回归的输入。为模拟与位置相关的入射光,颜色空间还将位置x作为输入。作者观察到随时间变化因素影响人的外表,例如二次照明和自阴影。作者受自编码的影响,引入了隐嵌入来编码每个视频帧t中随时间变化的因素。

060a92adab47d0180dc6ccbaf97ad47e.png

体渲染

给定一个视点,作者利用经典体渲染技术将体神经渲染到2D图像上。像素颜色通过体渲染积分公式来评估,沿着相机光线方向累加体稠密度和颜色。这个需要确定一个边界,可以根据SMPL模型进行确定。

57ff6836b2b9060d78948909af215e16.png

87690f7bad49b06faca568ea8ef91c95.png

训练

通过体渲染技术,作者优化体神经去最小化观察图像的渲染误差:

d2d5000122b1944ac1a8bce5477c0d02.png

5d890caa5ae84ed0a48ee16890b1f34a.png

03 结论

下面我们从数据指标和可视效果两个方面,来观察本论文提出方法的有效性:

00efc5f46adfbd1c3016899c58f408f2.png

从上边指标可以到,本论文提出的方法的PSNR超过了当前流行的NerF和NV方法

d1ce5373d8a3628fd391a2222f486f28.png

本论文可以在稀疏视角下,可以得到较好的新颖视点结果。

064ce3d0caf0e6275cb75e716db89811.png

上面为多视角视频下,得到的人体3D模型。

21a37d6c4dfc436d3cb09b634eb79889.png

上述为单目视频得到的新颖视角图像和人体模型

每天我们会定期发布最新关于《计算机视觉与图形学》相关论文和知识,请扫描下方二维码关注我们:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值