ECCV 2024 | JHU提出X-Gaussian，首个可渲染X光的三维高斯泼溅方法

PaperWeekly

于 2024-09-08 23:51:22 发布

阅读量475

点赞数

原文链接：https://mp.weixin.qq.com/s?__biz=MzIwMTc4ODE0Mw==&mid=2247681890&idx=2&sn=fc369d44b9e7226a3f100090f8060e3f&chksm=97d763dab5e8fd46daceaa2d19d0347657ed48d52995d871695712248f5eb82afe5cad3c7e22&scene=126&sessionid=0

版权

©PaperWeekly 原创 · 作者 | 蔡元昊，Alan Yuille

单位 | Johns Hopkins University

研究方向 | 计算机视觉

本文介绍我们在 ECCV 2024 上的新工作《Radiative Gaussian Splatting for Efficient X-ray Novel View Synthesis》。

论文链接：

https://arxiv.org/abs/2403.04116

代码链接：

https://github.com/caiyuanhao1998/X-Gaussian

视频链接：

https://www.youtube.com/watch?v=v6FESb3SkJg&t=28s

media report by AK:

https://x.com/_akhaliq/status/1765929288044290253?s=46

media report by MrNeRF：

https://x.com/janusch_patas/status/1766446189749150126?s=46

本文提出了首个能够渲染 X 光的 3D Gaussian Splatting 框架以用于 X 光的新视角合成（Novel View Synthesis, NVS）。值得一提的是，我们的方法无需计算耗时的 Structure-from-Motion（SfM）算法来进行初始化。我们的工作还被推特科研风向标的 AK 和 MrNeRF 大佬转发报道。

▲ 图1 高斯点云分布在模型训练中的变化过程

目前所有的代码、数据、高斯点云模型、训练日志均已开源，欢迎大家来使用或是提交 issue。

X 光新视角合成任务介绍

X 光由于其强大的穿透力而被广泛地应用于医疗、安检、考古、生物、工业检测等场景的透射成像。然而，X 光的辐射作用对人体是有害的，受试者与测试者都会受到暴露于 X 光下的影响。为了减少 X 光对人体的伤害，本文研究稀疏视角下的 X 光三维重建任务 —— 新视角生成。即只拍摄少数几张 X 光片，剩下视角的 X 光片通过渲染得到，用以帮助医生进行诊断分析。

NeRF 类重建方法由于需要密集地采集射线，并在射线上采样多个 3D 点，计算后通过再通过 volume rendering 渲染得到 2D projection。这一过程非常消耗时间。当前正火的 3D Gaussian Splatting （3DGS）因为其高度平行化的渲染方法 —— Rasterization 而有着比 NeRF 更快的渲染速度。然而 3DGS 是针对自然光成像设计的。

直接将 3DGS 用于 X 光成像会遇到两个问题：

（i）首先，如图 2 所示，自然光成像主要依靠于光线在物体表面的反射，这使得从不同角度看，物体表面的颜色会有差异。为了拟合这一各向异性的特点，3DGS 采用球谐函数（Spherical Harmonics，SH）来模拟自然光的分布。然而在 X 光成像中，X 光穿透物体并衰减，然后落在探测器上成像。X 光无论从各个角度穿透同一物质点，其衰减都是一样的。直接使用 SH 很难拟合 X 光成像的这一各向同性的特点。

（ii）其次，3DGS 的初始化需要通过计算 Structure-from-Motion（SfM）算法来得到各个视角的相机内外参数以及一个稀疏点云作为起始。这个算法十分耗时，增加了患者和医生的等待时间。

▲ 图2 3DGS 自然光成像与 X-Gaussian 进行 X 光成像对比

本文针对上述这些问题展开研究，做出了以下四点贡献：

针对 X 光新视角合成任务，本文提出首个基于 3D Gaussian Splatting 的技术框架——X-Gaussian。
我们设计了一个全新的辐射高斯点云模型（Radiative Gaussian Point Cloud Model），基于该模型我们又设计了一个可微的辐射光栅化渲染方法（Differentiable Radiative Rasterization）。
针对我们的高斯点云模型，我们提出了一种初始化方法——Angle-pose Cuboid Uniform Initialization（ACUI），这种初始化方法能够通过 X 光扫描仪的设备参数和旋转角直接计算出相机内外参数和初始稀疏点云，这使得我们方法免于计算 SfM，从而大幅提升训练速度。
我们的 X-Gaussian 在性能上超过当前最好 NeRF 方法 6.5 dB 的情况下，推理速度还达到了 73 倍。同时我们在传统算法上也验证了，通过我们方法合成的新视角 X 光片能够提升 CT 重建的图像质量。

空间坐标系的转换

我们在圆形扫描轨迹锥形 X 光束扫描（circular cone-beam X-ray scanning）场景下研究三维重建问题。空间坐标系的变换关系如图 3 所示。被扫描物体的中心 O 为世界坐标系的原点。扫描仪的中心 S 为相机坐标系的中心。探测器 D 的左上角为图像坐标系的原点。整个空间坐标系的变换遵循 OpenCV 三维视觉的标准。

▲ 图3 空间坐标系转换关系示意图

本文方法

▲ 图4 X-Gaussian 算法框架流程图

我们算法的流程图如图 4 所示，首先通过图 4（a）中的 Angle-pose Cuboid Uniform Initialization（ACUI）来计算出 X 光源（Source）在对应旋转角下的相机内外参矩阵并计算出初始稀疏点云。

然后，我们针对 X 光各向同性的成像特点设计了辐射高斯点云模型（Radiative Gaussian Point Cloud Model），如图 4（b）所示。针对这一点云模型，我们还设计了一个可微的辐射光栅化（Differentiable Radiative Rasterization，DRR）渲染方法，用于三维高斯点云的泼溅渲染，如图 4（c）所示。本节我们先介绍辐射高斯点云模型，然后是可微的辐射光栅化，最后介绍 ACUI 初始化方法。

3.1 辐射高斯点云模型

本小节我们首先回顾一下 3DGS 的基本知识。3DGS 将一个物体或场景用个高斯点云表示如下

其中的表示第个高斯点云，分别表示高斯点云的中心位置，协方差，和不透明度。协方差控制高斯点云椭球的三轴大小，即控制点云的形状。3DGS 对每一个高斯点云采用球谐函数来拟合其颜色如下：

其中，表示颜色，表示观测视角，表示球谐函数系数，表示球谐函数，将球面上的点映射成一个实数值。然而，如我们前面的分析，球谐函数并不适合用来模拟各向同性的 X 光成像。

为此，我们设计了一个辐射强度响应函数（Radiation Intensity Response Function, RIRF）来替代球谐函数。具体而言，我们让每一个高斯点云学一个特征向量其固有的辐射属性，如辐射密度等。然后该点云的辐射强度便可以被表示为

其中表示一组常数。因此，我们的辐射高斯点云模型可以被表示为

其中为可学习参数，表示分配给第个高斯点云的特征向量。

3.2 可微的辐射光栅化方法

基于我们提出的这个高斯点云模型，我们还设计了一个可微的辐射光栅化方法（Differentiable Radiative Rasterization，DRR）。我们将整个 DRR 的过程总结如下：

其中表示被渲染的图像，和分别表示内外参矩阵。接着我们介绍的细节。首先，我们计算第个高斯分布上的 3D 点的概率如下

接着，我们将 3D 高斯点云从世界坐标系中投影到相机坐标系，进而再投影到图像坐标系上：

其中的表示相机坐标，表示图像坐标。三维的协方差矩阵也被对应地投影到相机坐标系上：

其中是投影变换（projective transformation）的仿射近似的雅克比矩阵。是 viewing transformation。

其中的表示 X 光扫描仪中 X 光源（source）和探测器（detector）之间的距离。表示 X 光源的旋转角。然后在图像坐标系下的二维协方差矩阵是直接取的前两行前两列。将 2D projection 分割成互补重叠的 titles。每一个三维高斯点云都按照其对应投影所落在的位置分配到对应的 tiles 上。

这些 3D 高斯点云按照与二维探测器平面的距离进行排序。那么，在 2D projection 上像素点上的辐射强度便是混合个与重叠的排好序的 3D 点得到的，如下公式所示

其中的表示落在像素上的 X 射线与高斯点云之间的交点，表示的辐射强度。模型训练的监督函数是一范数损失与SSIM 损失之间的加权和：

其中的是加权稀疏，可调的超参。

3.3 角度位姿立方体均匀初始化

常规的 3DGS 使用 SfM 算法来计算每一个视角的相机内外参数以及初始的稀疏点云。SfM 算法的原理是检测不同视角投影之间的特征匹配点。对于 X 光片这种低对比度的图像来说，SfM 的检测精度会降低。同时运行 SfM 非常耗时，对几十张图像计算 SfM 可能需要耗费几个小时。这大大延长了病人和医生的等待时间。

为此，我们设计了角度位姿立方体均匀初始化（Angle-pose Cuboid Uniform Initialization, ACUI）算法。ACUI 首先直接使用 X 光扫描仪的参数来计算相机的内外参矩阵：