NeRF_er-CSDN博客

原创 OminiScenes代码阅读

Pixel-gaussian 的预测是一个 Unet 的结构，每一个 Pixel 预测一个 Gaussian (加载的数据如下：包括。

2025-05-22 20:39:46 388

原创从 Overleaf导出项目，使用 Arxiv Cleaner 进行上传

点击 Submit -----> Arxiv 导出 ------> 选择下载。的源码在 Github 上面进行下载。比如我下载的文件夹解压之后是。执行之后会生成一个新的文件夹。这个便是清理之后的文件夹。

2025-03-18 11:08:08 294

原创 inkscape 的配置Latex 编写公式

【代码】inkscape 的配置Latex 编写公式。

2025-02-25 10:28:02 309

但是这些Gaussian 只是离散的时刻，为了得到更为 smooth 的图像， L4GM 并没有选择对于Gaussian 进行 Track 然后渲染。帧作为输入，然后选择其中的第一帧的作为 Diffusion 的 Condition 生成3 张 Ref image.的独立的 Gaussian. 使用不同时刻 Gaussian 渲染的图像，进行插值，构造时刻。时刻之间的3D gaussian , 再进行渲染，得到更为 Smooth 的 2D 的图像。concat 在一起,。

2025-02-11 16:13:05 696

原创 Street Surf 的学习

定义了一个 scenebank 的数据结构。

2025-01-06 21:39:34 490

原创使用Windows 自带的图片改变图像的任意分辨率 & Video 转Gif：

点击调整图像大小，可以适配到任意的分辨率。

2024-10-11 10:08:42 593

原创 MuRF代码阅读

个点，那么组成的 Tensor pts_3D 对应的 shape 是 # [B,HW,D,3]，将这些采样点投影到 feature_map 上面然后计算 Reference Image 之间的。MuRF 可以对于高分辨率的图像在 Test 的阶段做 Rendering。之后的图像生成的，假设原图像的分辨率是。，去得到 Geometry 的 Cues.，那么会从降采样4倍之后的图像。生成的 Ray 是从。

2024-08-01 20:08:30 645

原创 Pytorch Lighting & Hydra库的学习

都是需要先自己定义一个 Dataset, 然后根据自己定义的 Dataset 去实现对应的 Dataloader在 DataModule 里面需要实现3个。

2024-06-14 11:33:05 1563 1

原创 mvsplat 的笔记

因此，代码里有两个 for loop, 一个循环 .torch 文件，一个循环 torch 文件里面的数据集。每一个 pixel 生成一个坐标, 对应一个 Gaussian. Pixel 发生光线，，通过卷积变成2个通道，其中一个作为 density, 另一个作为视差。. 并不一定是从像素中点发生光心，因此，每一个 pixel 还有一个。的4个通道预测的，先得到四元数。图像，而每一个数据集的以字典的形式进行存放。：表示投影的 refrence image。，也是泛化得到的，从。

2024-05-29 11:55:30 1850 3

原创将针孔模型相机应用到3DGS

下面这个 Projection_Matrix 的构建和上面公式推导会有一点不一样的地方，尤其是对于 Z值的计算上，Github 上也有人提出过疑问。，然后我们再通过线性变换做正交投影将Cuboid 的长和宽分别缩放到一个单位立方体, 即将 [l, r] ⇒ [-1, 1] and [b, t] ⇒ [-1, 1]。【就是把（l,r）映射到（-1，1）】,最后才可以变换到Clip坐标系下面的坐标。上面的恰好是 Clip 坐标系的齐次坐标系。3DGS 的投影采用的是 CG系的投影矩阵。

2024-04-28 22:48:29 2378 2

原创 3DGS CUDA代码笔记

真实的 Render 过程是在下面这个函数执行的，我们。

2024-04-23 17:21:41 1966

原创 VScode 里面使用 python 去直接调用 CUDA

上一个帖子主要分享了如何去将 C++ 程序打包成一个package。我们最后的目的实际上是想把 CUDA 的程序打包成一个 Package ， C++ 程序只是起到了桥梁的作用：我们的文件由一个 Cpp 文件组成，负责当作 CUDA 和 Python 的桥梁，将这个cpp 文件命名成 ext.cpp.cpp_properities.json 配置文件CUDA 部分：CUDA 的头文件 *** interpolation_kernel.h ***对应的源代码文件*** inte

2024-04-19 16:49:47 886 1

原创 VScode 里面 Python 当中去调用 C++ 代码

VScode 里面应该安装 Python 和 C++ 的插件。

2024-04-18 14:07:13 508

原创 Scaffold-GS 代码阅读笔记

*scaling ** : 每一个 anchor_point 额外有一个 scaling 的属性，其初始化时每个3D点到最近3D点的距离，但是却 repeat 了6次，因此 shape 时（N，6）. 这个 scaleing factor 不是高斯的属性，不能理解为协方差中的 scale，而是一个缩放因子。需要注意的是，根据视场角 fov 的定义，对于图像进行长和宽等比例的降采样之后，视场角FOV 是保持不变的（如果考虑相机的主点不存在偏移的话）。剩下的图像作为 Train Image.

2024-04-11 21:01:22 3068 3

原创 Splatstudio 学习笔记

3.2 修改 Camera 的坐标，将其从 nerfstudio 的坐标旋转到 opencv 的坐标。SH 的稀疏的 shape 标准是（N，16，3）；快速的方法，将图像分成 16*16 的tile;计算每一个 Tile 和圆的相交区域。计算每一个像素到2D 投影圆的距离，并且依据高斯分布求解出 opacity 的大小。圆的圆心，可以直接通过 3D Gaussian 的中心点 Center 投影得到。返回值是一张全图的 RGB 和对应的 Camera。计算每一个像素的颜色。

2024-04-08 16:25:15 1477

原创 Spade CNN技术细节

Input: (1,3,256,64,128)做downsample 成 : (1,3,8,16,32)首先有一个 EqualConv3D(3,128,3,3,stride=1,padding=1) 对 input 进行卷积得到：(1,128,8,16,32)input channel: 3output channel: 128然后经过第1个 Spade Block：将 input 的 Volume (1,3,64,128,256 )进行下采样（1,3,8,16,32）上面是一个 Spad

2024-02-29 14:33:45 291

原创 MVSNerf 代码阅读 & Pytorch Lighting 学习笔记

图像的分辨率是 Input Size: 640*512光线采样的方式也是Random Image + Random Ray 的方式去采样的。

2023-12-23 19:52:34 833 1

原创 Pixel Nerf代码阅读

SB： scene batch 场景的个数；4NV： number input ，每个场景的视角，也就是图像的数量；49每条光线首先会采集 64个采样点，一次训练4 个场景，每个场景随机【用上了该场景的所有的图像】选择128条光线，因此光线的 shape (4,128,8)在 compostit_alpha 函数里面，使用 Z 的数值生成采样点 points, point 的 shape 设置为（4,8192,3）表示一共有4个场景，每个场景生成 8192条光线。

2023-12-20 20:50:01 1362 1

原创 DVGO 代码阅读

BBx 的大小范围是根据相机的位姿来构建的，会刚好 Cover 相机的移动范围，相当于 StreetSurf 里面的 close-range 的部分，代码在依靠这个 xyz 的前后边界来区分前景 fg 和背景 bgDensity Field 的 dim = 1;RGB Field 的 Dim = 12。

2023-12-15 21:29:13 427

原创关于BP 时候报错的汇总

之前的错误是背景 Nerfacto MLP的层数设定为8，导致会在BP 的时候报错。保存在哪一个 step 会报错的checkpoint, 然后尝试去。这个错误，如果能复现这个 Bug, 然后去debug 会方便很多。注意前面需要乘以系数。

2023-12-12 10:31:34 620

原创 IBR-net 代码研读

假设原图的 shape (512,512,3), 选择原图相近的 10张图像，经过U-Net 类似的结构之后，生成的特征Tensor 是（10,64,128,128）。这个特征图分成2个（10,32,128,128）和（10,32,128,128）分别送入到 Coarse IBR-net 和 Fine IBR-Net 中去。通过一个MLP，将每个世界点到相关方向的 direction (500,64,10.3) 通过MLP 学成（500,64,10,35）维度的feature。

2023-12-04 11:01:00 504

原创 mmcv的环境真 TM 难配还有JAX 的环境配置

搞了个晚上陪深度补全的 completionformer 没配出来。首先搞定 MMCV 的配置：MMCV 一般无法使用 pip 进行安装，因为服务器没办法翻墙，需要将 wheel 文件下载下来之后，采用离线的安装。

2023-11-16 11:33:01 572 1

转载安装 inplace_abn 遇到CUDA 的问题

原文链接：https://blog.csdn.net/hezhongla0811/article/details/110673512。其他模块遇到这个类似的这个问题，也可以先清除pip 缓存，指定CUDA 然后 pip 才会根据 cuda 去安装对应的模块。

2023-11-10 16:59:50 2311

原创切换nvcc 的CUDA 版本

配置完成，可以用nvcc -V命令查看当前的CUDA（nvcc）版本。可以看到安装过不同版本CUDA的路径。

2023-11-10 16:32:18 1331

原创在 eval 的时候运行一遍网络，发现显存增加特别快

解决方法是：在被调用的网络函数前面加一个装饰器，（这个函数可以是专门用来eval 的时候用的），

2023-09-06 16:08:11 220

原创 Python 中的值传递和引用传递

在第二行加上 clone 函数之后，才可以保证执行完第二行之后的 position 的数值不会发生变换。

2023-08-08 21:11:23 1156

原创在Geogle Drive 上面下载压缩的文件

需要使用到 OCC3D 上面的Waymo Occupancy 真值。Occ3d 应该是一个文件夹里面有很多个压缩包，如果直接下载会下载很多个文件。双击点进去选择好对应的序列再进行下载。这里的 000 001 应该是对应的 waymo 的相机序列。waymo 的相机序列也是798 个序列。

2023-08-02 20:40:57 430

原创 Vscode 配置 .ssh/config 文件的时候不能添加新的主机名 & VScode 的一些Bug

vscode 添加多个远程Host

2023-03-06 16:36:50 609

原创 SDF_studio 实验记录

sdfstudio 阅读笔记

2023-01-29 23:16:05 1490 1

原创 Nerf_studio 使用记录

Nerf_studio安装和使用记录

2022-12-29 14:34:50 9638 12

原创求出Pose(4*4)矩阵的 t 的平均值，并且减掉 t的均值

Numpy 数组不同维度的加减法

2022-11-24 11:53:52 483 1

原创 python将写数组 txt, 读数组并画图

numpy 到txt 写入并读取

2022-11-01 10:07:38 339

原创 Vim 学习笔记

我的ViM 学习命令记录

2022-10-21 20:57:26 635

原创 Nerf Pytorch 代码 shuffle_ray 代码阅读

Nerf 代码阅读与注释

2022-09-25 16:12:02 1113

原创 Pytroch Nerf代码阅读笔记（LLFF 数据集pose 处理和Nerf 网络结构）

Nerf Pytorch 代码阅读笔记

2022-08-31 12:25:02 8486 6

原创 Pytorch 中的tensor 、ndarray、 PIL图像格式互相转换的代码

pytorch 中 tensor 的转化和使用

2022-08-11 18:28:51 1923

原创在服务器指定GPU进行训练

服务器上指定GPU训练模型

2022-07-07 12:40:39 6131 1

原创使用Calibr标定相机内参数

参考网站利用 kalibr 标定 Camera-IMU 外参:https://blog.csdn.net/HERO_CJN/article/details/891758391. 安装配置 kalibrGithub 网址下载源码.https://github.com/ethz-asl/kalibrmkdir -p ./kalibr_workspace/srccd ./kalibr_workspacesource /opt/ros/melodic/setup.bash// 初始化 ca

2022-04-20 10:12:01 580

原创 Mathtype中预置新公式来统一格式化公式

word 中格式化 mathtype 格式

2022-02-28 16:02:12 15253 4

TUM RGBD数据集 适用于动态场景的SLAM

空空如也

TUM RGBD数据集适用于动态场景的SLAM