weixin_47343723-CSDN博客

原创 Surface reconstruction随机

真的好久没有看论文了，最近到底在忙些什么。

2025-10-16 11:04:52 141

原创 neuralangelo记录

提心吊胆地跑nerualangelo，不仅是因为github上的tnt出问题的人太多了，还担心motivation验证不出来吧。

2025-09-23 11:34:06 218

原创 Anti-Aliasing/Mip-NeRF/Zip-NeRF/multi-scale representation

CSDN的文章写太多，都不记得之前写的有什么了，但习惯了在这里记录，先写上吧。关于multi-scale representation又是看着忘着，还是写下点什么比较啊。时看时新，还是想吐槽自己看论文太不认真了。下面直接按照文章顺序展开介绍。

2025-08-11 21:45:43 207

原创 AAAI赶稿后的心得

这是你的文章，永远不要想着靠谁来主动找你帮你写，也不要怕麻烦别人，这本身就是互相沟通学习的过程。真的好想有一天也可以像郭老师那样，零帧起手写论文。已经第三次和老师们一起赶稿了，但是还是纰漏重重，每次都被我的垃圾写作给吓到。写一下自己的感受吧，我感觉老师们都在全力去帮我完善，奈何我真的在这个过程中交流的太少了，

2025-08-02 21:19:58 313

原创 CVPR2025 dynamic GS

每次都看着忘着，到头来发现是自己又看过的文章，效率实在太低了，还剩几篇文章就顺带整理一下，应该一开始就弄的，哭！

2025-05-02 13:07:42 610

原创 VLLM（gemma3）部署

token自己去Huggingface注册账号申请，一次性token。困难重重，但好在国内已经存在开源网站了，在各种资料的帮助下终于。（位置大概在左上角很大一个区域）。

2025-04-16 13:03:14 1408

原创 RoMo: Robust Motion Segmentation Improves Structure from Motion

看起来像是一篇投稿CVPR的文章，不知道被哪个瞎眼审稿人拒了。同期还有一篇CVPR被接收的工作Segment Any Motion in Videos，看起来不如这篇直白（也可能是因为我先看过spotlesssplats的缘故），后面也应该一并介绍了的。总体来说：就是如何给sam2提供一个很好地prompt，获得视频序列的dynamic mask 分割结果。

2025-04-05 23:12:41 372

原创 COLMAP-Free + Segment

无位姿的GS都已经更新第二轮了，我才开始看最开始的SOTA。

2025-03-21 12:18:29 286

直接4DGS+GS grouping存在问题：由于存在GS漂移，所以会导致无法满足同一GS所有时刻都表示同样的物体，导致错误表示。所以作者提出，应该不同时刻的同一GS可能属于不同的类？这点我真的有点难以理解，但加入时刻t作为输入后，效果又确实变好了。那么我觉得应该思考一些，那一篇tracking文章的约束，保证高斯的移动方向要一致，是不是就可以解决漂移问题，从而再次保证不同时刻的同一GS表示同一物体？文章核心是对GS分类时要加入时间信息，但是如果GS本身就已经被区分为动静态的话，还需要这样做吗？

2025-03-05 18:20:54 196

原创 Hugging Face网络连接问题

趁着模型下载，记录一下hugging face遇到的网络连接问题，难道只有我想吐槽这个垃圾的科研环境什么时候是个头吗？hugging face到底方便了谁，又绊住了谁。到底什么时候才能没有那堵墙？感觉大家都挺坦然接受的。每次配环境面临的问题是在日本的几倍甚至几百倍。

2025-02-12 14:44:56 391

原创 Underwater 系列coding记录

load data随机选一张做它的rendering，此时开始做Gaussian splatting，输入点云、时间戳等等参数，估计Motion和GT做loss，对gaussian做剪枝整个过程还是很清晰的，接下来的任务是找到那个threshold。作者说这里的Δ\DeltaΔ是高斯相对于标准空间的位移，那么静态点到底会不会相对标准空间伪影呢，或者位移多少？在看光栅化的时候，突然反应过来一次渲染一张图啊，nerf也就是1024条光线，大一点4096条，那么这之间差了可不止几倍呢。

2025-01-23 11:17:05 410

原创 Neuralangelo代码重点部分

又是一篇新文章，最近完全没有动力搞下去，不知道是因为要放假了还是想退学，anyway，有了一点点新的idea想基于这篇文章验证一下。

2025-01-12 14:26:35 279

原创写给自己的一些心得体会(+年终总结)

总之，不要投机取巧，不要视而不见，我想我一瞬间还是会产生些邪恶的念头，不过在想象自己站在演讲台讲述自己论文的时候心虚的样子，一切就会戛然而止。曾经我会抱怨团队，抱怨实验室没显卡，现在即使在一个完美的团队，我依然还是这样，真的全是我自己的问题，浮躁、不愿意深度思考问题，论文看得太少、表达能力太差。我时常在想我在日本的这几个月到底收获了什么，我不知道这样的生活是不是还该继续，我是不是真的没办法搞科研，我真的好希望有一天骄傲的站在演讲台上讲述自己的文章，又或许那一天永远也不会来临。

2024-10-26 15:49:01 546 1

原创 Ref-NeuS参数记录

这篇文章中的uncertainty估计非常值得参考，尤其是寻找当前view到其他view的投影点，这里记录一下这部分代码的参数，因为它起名实在太混乱了！！

2024-10-02 12:03:09 299 2

原创 Aborted (core dumped)

这里有两个值，四个pixel的avg按正常的值求出来，没有梯度；主要是怎么从中心点出发，扩大半径以求解对应的normal，这里为了不增加额外计算，就把sdf_lloss那部分不同半径同一位置计算的sdf删掉了，即： cal_sdf_loss=False，但显然这样或造成计算图不一致报错（我猜是这个原因），总之加入额外计算后就不再报错了。

2024-09-16 12:52:52 332

原创 K-Planes代码记录

原文，又要换baseline，可是效果不好能怎么办呢，我可不可以发疯。k-planes的代码又是非常工程琐碎的，大佬的代码果然不顾小白死活。随便记录下整个过程。

2024-07-01 17:02:54 850

转载 Docker常用命令记录

仓库：存放镜像的地方镜像：通过多个，可以独立运行一个或一组容器。容器的启动、停止、删除。（简易的操作系统系统）。

2024-03-29 09:20:28 123

原创 Tri-MipRF: Tri-Mip Representation for Efficient Anti-Aliasing Neural Radiance Fields

按照这个版本安装，tinycudann不在报错。（好烦啊，主页上还说要安装cu11.6，结果根本不可以）

2024-01-24 11:23:27 1162 5

原创 NeuS代码记录+nerf-W+ Multi-NeRF 报错解决方法

每天都想着早走，每天都没办法早走，真的是又气又烦，总有改不完的bug。

2023-08-13 16:49:01 1014 11

原创 nerf-studio初体验

整个安装过程非常简单，运行得也很丝滑，最大的难点在于中文资料太少，英文看得头痛。本文也是参考了许多链接，有些比我写得详细多了，各位选择性看吧。

2023-06-29 14:12:48 1479 1

原创 NeRF+SLAM论文阅读笔记

2.编码方式：one-blob（提升未观察到区域的补全能力和一致性）编码方式根据场景表示（hash网格）制定。iMap：由于实时性的要求，iMap使用系数采样和减少迭代次数提升效率，造成丢失高频细节&增大误差。1)场景表示：联合坐标+参数编码-------MLP---------->RGB和SDF。3)mapping：从所有帧采样的全局射线进行全局BA，联合优化map&pose。场景表示：如八叉树、哈希/体素网格等虽然可以提升效率，但缺乏MLP固有的。1.场景表示：多分辨率哈希网格（加速&保留高频特征）

2023-06-15 10:26:41 1963 4

原创深度估计阅读记录

使用SDF这种表示方式替换NeRF中的MLP，使得在获得更准确的结果。我们通过的函数来实现这一点（We achieve that by modeling the volume density as a function of the geometry.）。：1. 将体密度利用公式转为SDF，使得alpha和beta是可学习的参数。其余看不懂。总之，文章的核心应该在于，从而可以将desity表示为SDF进行优化，以及实现一系列其他目的，比如：分离颜色和几何。

2023-06-08 15:07:28 891

原创 NeRF-SLAM代码记录

因为有相关依赖，所以尽量使用命令下载代码。2. 新建nerf-slam环境，github上也没提到python是哪个版本，这里就随便选了一个（这个github真的好简陋），下面这几行都是按照mip-nerf-pytorch的代码安装的3.安装torch到这一步就彻底卡住了5.编译，在执行，（以下顺序不太记得了）会出现无数个错误出现接着出现hash - r然后出现，需要进行一系列的安装接着出现以上全都安装完成后，执行以下命令，应该需要几分钟时间吧这个步骤遇到过很多奇奇怪怪的错误，以下逐一列出。

2023-05-28 22:24:44 1132 1

原创 Point-SLAM: Dense Neural Point Cloud-based SLAM阅读记录

早期的场景表示使用TSDF，之后使用可扩展(scalable)的表示方式，如：octree等，更进一步地，还可以在tracking上加入loop做改进（BundleFusion）；解决noise depth maps（RoutedFusion），NeuralFusion和 DI-Fusion在此基础上进行扩展；使用RGB作为输入；优化测试时间…

2023-05-15 21:32:49 2004 1

原创 NeRF相关文章记录

当输入的位姿不准确时，也可以通过错误的位姿获得正确的建图。

2023-03-29 16:33:11 443

原创 windows跑通instant-ngp过程记录

总之先使用git命令下载一部分（这一部分也会随机报错，多尝试求好运吧），然后等子模块报错时再一个个去denpendencies下载。，需要注意的是，要跟着youtube或者b站视频来安装，视频时长20min左右。

2023-03-24 18:39:34 1760 5

原创关于colmap+nerf对数据集进行预处理的使用总结

零零碎碎的东西太多，有必要统一记录一下，因为是回忆步骤，所以可能有不准确的地方。

2023-03-22 14:24:45 6626 6

原创坐标系转换问题

已经是第n次写坐标系转换问题了，但是之前都是零散的写，还是需要系统总结一遍。

2023-03-14 09:48:02 712

翻译 SLAM中坐标系的转换问题

t2=[0.3,0.1,0.1]^T (q的第一项为实部。这里的q和t的表达的是Tcw，也就是世界到相机的变换关系。小萝卜二号的位姿为q2=[-0.5,0.4,-0.1,0.2],t=[-0.1,0.5,0.3]设有小萝卜一号和小萝卜二号位于世界坐标系中，小萝卜一号的位姿为：q1=[0.35,0.2,0.3,0.1],T ,求该向量在小萝卜二号坐标系下的坐标，请编程实现此事。T_1w :表示世界坐标系到小萝卜一号坐标系的变换关系。T_2w:表示世界坐标系到小萝卜二号坐标系的变换关系。

2023-02-27 20:39:29 503

翻译 SLAM数据集和评价指标

SLAM数据集

2023-02-26 09:22:47 1687

原创 NICE-SLAM: Neural Implicit Scalable Encoding for SLAM论文阅读记录

论文看到一半的时候给别人安利，突然被问起这篇文章创新点是什么，我竟然答不出来，又看了个寂寞，于是写下这篇总结。

2023-02-18 22:23:38 1891 5

原创 DSGN++记录

以上如此复杂，3D Camera转点云，对点云进行截取，再点云转图像，为什么不直接使用图像2D粘贴呢？是因为路面那里需要伪点云吗？也包括是否重合更好判断吧。可以展示出最后的增强的效果（只是单独的copy_paste策略，其他的增强方法在后续的for循环中可以看到）。7. 把图像投影至检测框的大小，使用Opencv函数视觉投影(6. 读取点云和图像，点云似乎没有用到只是添加进了列表里。后面就是字典的添加，没耐心细看了，返回一个字典。8. 将图像对应像素点替换为warp后的图像。

2022-11-22 22:12:59 791

原创使用DSGN++训练自己的数据集

今天在看waymo数据集的时候突然发现也有灰度相机，回想了一下kitti也是灰度相机，莫非…双目相机大部分都不是全彩色？（waymo数据集需要自己去了解+下载）关于如何使用DSGN++测试waymo数据集，我大致有直接利用OpenPCDet里读取数据集的方法，生成waymo数据集下的.pkl文件，修改.yaml中数据集路径。把tfrecord中的数据全部读取出来，包括label、lidar、calib、image等，像kitti一样进行组织，再生成.pkl文件。

2022-11-18 17:17:32 986 8

原创记录kitti数据集的坐标系转换问题

P0~P4相机内参相机外参3D相机坐标系(x,y,z,1) —>2D图像(u,v,1)世界坐标系/点云坐标系(X,Y,Z,1) —>3D相机坐标系(x,y,z,1)维度不变 3*4添加维度 3*4到4*4Tr_velo_to_cam称为外参矩阵，由旋转+平移矩阵构成，为了保证维度，需要同时对点云和矩阵进行升维。总之，就是一个内参、一个外参，一个不加维度，一个变为4*4，相应的数据也都跟着多了一维。看起来似乎很简单，但我还是看了好几天。

2022-11-07 11:50:22 3759 10

原创 ConnectionRefusedError: [Errno 111] 拒绝连接 vscode调试代码

搜索了一堆方法，不是废话就是无效。这个界面，找到冲突的端口然后关掉。

2022-10-25 21:03:18 2643

原创 mmdetection/OpenPCDet初体验

安装环境的过程很简单，参考。

2022-10-21 18:22:03 444 2

原创指定GPU运行pytorch模型的n种方法

在Terminal终端输入（以下均以指定使用gpu1为例）或者直接。

2022-10-19 18:21:30 2169

原创记录远程桌面连接出现Connection Problem, giving up

远程桌面连接出现黑屏或蓝屏。

2022-10-13 11:13:00 1488

空空如也

空空如也