【论文精读】NeRF中的数学公式推导

YuhsiHu

已于 2022-04-24 14:09:55 修改

阅读量6.6k

点赞数 49

分类专栏： NeRF/GS 文章标签：计算机视觉

于 2022-04-24 12:14:26 首次发布

本文链接：https://blog.csdn.net/YuhsiHu/article/details/124318473

版权

NeRF/GS 专栏收录该内容

18 篇文章

订阅专栏

这篇文章用于记录NeRF论文中数学公式的推导过程。
论文里的第一个公式就很硬核，展示了相机射线的期望颜色的计算方法。
5D 神经辐射场将场景表示为空间中任意点的体积密度和定向发射的辐射。文章使用经典体积渲染的原理，来渲染任何穿过场景的光线的颜色。体积密度 $σ (x)$ 可以解释为射线终止在位置 $x$ 处无穷小粒子的微分概率。而期望的颜色 $C (r)$ （相机光线 $r (t) = o + t d$ ，近处远处界限为 $t_{n}$ 和 $t_{f}$ ）可以被表示为：
在这里插入图片描述
这个结论来源于1995年Max的一篇文章Optical models for direct volume rendering，是体渲染的开山之作。这篇文章将光线模型分为三类，我们逐个看一看。

光线吸收模型

简单来说就是吸收它们拦截的所有光，却不散射或发射任何光。假设粒子是相同的球体，半径为 $r$ ，投影面积 $A =πr^{2}$ ，设 $ρ$ 为每单位体积的粒子数。这个模型的传递方程是

$\frac{dI}{ds} = -\rho(s)AI(s)=-\tau(s)I(s)$

其中 $s$ 是沿光流方向的光线的长度， $I (s)$ 是距离 $s$ 处的光强度， $\rho$ 是光点密度。 $\tau(s) = \rho(s)A$ 称为消光系数，反映了光被遮挡的速率。整理并且等式两边同时积分：
$\frac{1}{I(s)}\frac{dI}{ds}=-\tau(s)$
$\displaystyle \int^{s}_{0}{\frac{1}{I(s)}dI} = \displaystyle \int^{s}_{0}{-\tau(t)dt}$
$ln\frac{I(s)}{I(0)}= \displaystyle \int^{t}_{0}{-\tau(t)dt}$

这个微分方程的解是：

$I(s)=I_{0}exp(-\displaystyle \int^{s}_{0}{\tau(t)dt})$

其中， $I_{0}$ 是在 $s = 0$ 处的强度，而 $T(s)=exp(-\displaystyle \int^{s}_{0}{\tau(t)dt})$ 是介于 $0$ 和 $s$ 之间的介质的透明度。在体渲染中，消光系数 $\tau$ 通常称为不透明度。

光线发射模型

介质还可以通过外部照明的发射或反射来增加光线。
如果粒子是透明的，但以每单位投影面积的强度 C 发光，这个 $I (s)$ 的微分方程为：

$\frac{dI}{ds} = C(s)\rho(s)A=C(s)\tau(s)=g(s)$

这个 $g (s)$ 被叫做源项。
我们把式子可以变为：

$d I = g (s) d s$

对两边进行积分：

$\displaystyle \int^{s}_{0}{dI} = \displaystyle \int^{s}_{0}{g(s)ds}$

这个方程的解是：

$I(s)=I_{0}+\displaystyle \int^{s}_{0}{g(t)dt}$

其中 $I_{0}$ 是 $s = 0$ 处的光强度。

吸收发射模型

实际上，空间中的粒子会遮挡入射光，并添加自己的光。因此，一个现实的微分方程应该包括源项 $g (s)$ 和衰减项 $I (s)$ 。我们只需要将前两种模型进行简单的数值加和（微分方程右侧加在一起），就可以得到这个模型的传递方程:

$\frac{dI}{ds} =g(s)-\tau(s)I(s)$

我们把 $\tau(s)I(s)$ 移到等式左边，然后都乘上 $exp(\displaystyle \int^{s}_{0}{\tau(t)dt})$ ，得到：

$(\frac{dI}{ds}+\tau(s)I(s))exp(\displaystyle \int^{s}_{0}{\tau(t)dt}) =g(s)exp(\displaystyle \int^{s}_{0}{\tau(t)dt})$

也可以表示为：

$\frac{d}{ds}(I(s)exp(\displaystyle \int^{s}_{0}{\tau(t)dt}))=g(s)exp(\displaystyle \int^{s}_{0}{\tau(t)dt})$

从volume边缘的 $s = 0$ 积分到眼睛的 $s = D$ ，我们得到：

$I(D)exp(\displaystyle \int^{D}_{0}{\tau(t)dt})-I_{0} = \displaystyle \int^{D}_{0}{(g(s)exp(\displaystyle \int^{s}_{0}{\tau(t)dt}))ds}$

把 $I_{0}$ 移到等式右边，然后等式两边都乘上 $exp(-\displaystyle \int^{D}_{0}{\tau(t)dt})$ ，我们可以得到 $I_{D}$ ：

$I_{0}exp(-\displaystyle \int^{D}_{0}{\tau(t)dt})+ \displaystyle \int^{D}_{0}{(g(s)exp(-\displaystyle \int^{D}_{s}{\tau(t)dt}))ds}$

第一项表示来自背景的光，乘以空间的透明度。第二项是源项 $g (s)$ 在每个位置 $s$ 贡献的积分，乘以位置 $s$ 到眼睛的透明度 $T'(s)=exp(-\displaystyle \int^{D}_{s}{\tau(x)dx})$ ，那么：

$I_{0}T(D)+\displaystyle \int^{D}_{0}{g(s)T'(s)ds}$

等式右侧第一项代表着从坐标 $0$ 点出发经过 $0$ 到 $D$ 的介质入射到摄像机的光强，称之为背景光，在NeRF中，这一项考虑为 $0$ 。所以在NeRF中，这个式子化简为：
$\displaystyle \int^{D}_{0}{g(s)T'(s)ds}=\displaystyle \int^{D}_{0}{T'(t)\tau(t)c(t)dt}$
其中 $T'(t)=exp(-\displaystyle \int^{D}_{t}{\tau(x)dx})$ 。

转变为NeRF当中的形式

上面的式子和NeRF原文中仍然有差别，这是因为NeRF和Max的文章中使用的坐标不同。Max文章中的坐标是让相机在D坐标，而无穷远点在0坐标，这样前面的推导就是正确的。但是NeRF中的坐标，是让相机在坐标原点，无穷远坐标就是无穷远，这样就可以得到：

$\displaystyle \int^{\infty}_{0}{g(s)T'(0,s)ds}=\displaystyle \int^{\infty}_{0}{T'(0,t)\tau(t)c(t)dt}$

其中 $T'(0,t)=exp(-\displaystyle \int^{t}_{0}{\tau(x)dx})$ 。

试想，其实在 $0$ 到 $\infty$ 不是所有位置上都有介质，介质总有边界，我们就可以定义近平面和远平面 $t_{n}$ 和 $t_{f}$ ，那么上述的积分其实可以写成：
$\displaystyle \int^{t_{f}}_{t_{n}}{T'(t_{n},t)\tau(t)c(t)dt}$

NeRF中把消光系数（也就是不透明度） $\tau(t)$ 叫做体积密度 $\sigma(t)$ ，那么上式可以整理为：

$\displaystyle \int^{t_{f}}_{t_{n}}{T'(t_{n},t)\sigma(t)c(t)dt}$

如果记 $T(t)=exp(\displaystyle \int^{t}_{t_{n}}{-\sigma(t)dt})$ ，那么上式可以变成：

$\displaystyle \int^{t_{f}}_{t_{n}}{T(t)\sigma(t)c(t)dt}$

而这一切讨论都是在固定射线的情况下，如果这个射线是动态的，我们还需要用 $r (t) = o + t d$ 来表示的话，那么 $\tau(r(t))$ 其实可以表示在 $r$ 这条射线上， $t$ 位置的体积密度， $c (r (t), d)$ 就可以表示在 $r$ 这条射线上， $t$ 位置对 $d$ 方向的光强。那么上式可以进一步变为：