【论文笔记】3DGS精读

iglues

已于 2024-09-23 12:10:52 修改

阅读量1k

点赞数 12

分类专栏： CG 论文笔记文章标签：笔记图形渲染 3d 论文笔记神经网络算法论文阅读

于 2024-09-23 08:45:17 首次发布

本文链接：https://blog.csdn.net/iglues/article/details/142448447

版权

CG 同时被 2 个专栏收录

1 篇文章 0 订阅

订阅专栏

论文笔记

1 篇文章 0 订阅

订阅专栏

3D Gaussian Splatting for Real-Time Radiance Field Rendering 论文精读笔记

项目网页链接：https://repo-sam.inria.fr/fungraph/3d-gaussian-splatting/

论文链接：https://repo-sam.inria.fr/fungraph/3d-gaussian-splatting/3d_gaussian_splatting_high.pdf

源代码链接：https://github.com/graphdeco-inria/gaussian-splatting?tab=readme-ov-file

1 前言

contributions：

提出各向异性的3D高斯作为辐射场的高质量、非结构化表示
提出3D高斯属性的优化方法，以及自适应密度控制（为高质量表达场景）
提出的算法适应快速GPU计算（cuda kernel）的方法，支持各向异性高斯的泼溅和快速的反向传播算法执行，快速生成新视角（*重要）

1+2 优化场景的算法

3 优化渲染速度的方法

2 3DGS

2.1 overview

输入：一组静态照片+SfM估计的相机姿态与点云

选用高斯原因：各向异性体积可用于紧凑地表示精细结构

用点云初始化高斯:

高斯性质：mean（位置），covariance（形状），opacity（不透明度）

各向异性的颜色可用**球谐函数（SH）**表示

通过3dgs优化参数+高斯密度的自适应控制操作来创建可以表示场景的辐射场

提速的关键：Gaussians用GPU快排

流程图：

在这里插入图片描述

2.2 可微的3dgs（构建高斯）

为什么选择Gaussians：可微+方便投影成2D（可以快速α混合）

3D Gaussian公式：
$e^{-\frac{1}{2}(x)^T\Sigma^{-1}(x)}$

PS：x为坐标矩阵；Σ为协方差矩阵，隐式地包含了mean（μ）信息

混合时G(x)乘以α（不透明度）

投影公式：
$\sum ' = J W \; \Sigma \; W ^ { T } \; J ^ { T }$

因协方差矩阵中的数据有范围限制，梯度下降算法易更新出无效协方差矩阵。

解决方法：

高斯可以类椭球，用梯度下降改“Σ”→用梯度下降改“椭球3r+scale+rotate”

scaling：3D vector s

rotation：四元数 q

2.3 3dgs自适应密度控制优化（优化高斯）

不同位置3dgs密度不同需要除点云初始化外的密度控制优化

需优化：μ，Σ，α，SH；密度（前后二者相关联）

2.3.1 优化

用SGD（随机梯度下降）优化，支持定制的cuda kernel

用sigmoid激活函数优化α，指数激活函数优化Σ的scale，以限制数据范围

初始化Σ（正实数*identity matrix）使得高斯为各向同性高斯，即分布密度值仅与到均值距离有关、与方向无关

以距离最近的三个点（SfM生成的点云）为标准生成初始化高斯

用标准指数衰减调度优化μ

生成图片对比目标图片的loss由D-SSIM（衡量两幅图片相似性的算法）得到：

$\mathcal{L} = (1 - \lambda)\mathcal{L}_1 + \lambda\mathcal{L}_{D-SSIM}$

PS：实验中λ取0.2

2.3.2 自适应高斯控制

用稀疏点云初始化出的高斯很稀疏，需控制单位体积中的高斯数量

预优化后，每100次迭代densify一次，并删除所有α值小于一个极小阈值的高斯

关注高斯覆盖率极低（under-reconstruction）和单个高斯极大（over-reconstruction）的位置，因还原度低，此类位置视图-空间位置梯度很大

因此设置视图-空间位置梯度阈值（实验中取0.0002），超过阈值则需densify，优化过程如下图：在这里插入图片描述

如图，对于欠重构处，克隆一个高斯并向位置梯度方向移动。

对于过重构处，分裂该高斯。新高斯的scale因子由实验得到（实验中取1.6），位置由原高斯作为采样PDF来确定。

在视图中占比过大的高斯可能由于距相机过近或本身过大，会定期被清除，以保证画面质量、控制高斯总数。

2.4 高斯的快速可微光栅化器（fast 3D→2D）

提速对象：投影渲染+高斯的快排（排相对视点的前后顺序，为了α混合）

2.4.1 该光栅化器特点：

为提速，先将所有高斯排序（距视点距离的顺序），再进行视角渲染；而非针对视角渲染的每个像素进行高斯排序
支持高效反向传播算法
内存占用小，每个像素固定占用一部分
光栅化管线可微，可投影各向异性高斯

2.4.2 渲染管线：

将屏幕分成多个16*16像素的瓦片（tiles）
进行视锥体剔除（frustum culling），以确定在视图范围内的高斯（只保留与视锥体相交99%置信区间的高斯）
再用一个防护带（guard band）去除位置过偏的高斯（eg. 过于靠后或过于靠近前剪裁面）
根据覆盖的瓦片数将每个高斯实例化，并给每个实例分配一个key，包含其在视图空间中的深度信息和覆盖的瓦片编号信息
基于key，使用GPU上的高效基数排序（fast GPU Radix sort）对高斯进行排序；后续渲染都基于这个顺序（可能会有瑕疵，但微不足道，速度更重要）
根据顺序（通过识别相对当下视点的最近高斯与最远高斯）为每个瓦片生成高斯序列，并为每个瓦片启动一个线程块 —— 即每一瓦片共享一序列，因此瓦片大小选择为重要指标
每一线程块将该瓦片对应的高斯序列加载进该块的共享存储器；对于块中每个像素，从前往后遍历共享序列进行α混合（最大化并行增益），累积至该像素的α达目标饱和度（唯一停止标准），停止遍历
以一定频率检查线程块中每个线程情况，当16*16个像素都饱和，该线程块收束
渲染出图像后计算loss、反向传播、优化参数……

特别地：
- 此方法不限制接收梯度更新的基本体数量，因此可灵活处理各类场景，无需特别调整
- 反向传播时，为减少动态内存开销，从后至前再次遍历所在瓦片对应高斯序列
- α代表该高斯对像素颜色的影响程度，因此可以决定该高斯从loss得到多少梯度指令