自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(54)
  • 收藏
  • 关注

原创 Surface reconstruction随机

真的好久没有看论文了,最近到底在忙些什么。

2025-10-16 11:04:52 141

原创 neuralangelo记录

提心吊胆地跑nerualangelo,不仅是因为github上的tnt出问题的人太多了,还担心motivation验证不出来吧。

2025-09-23 11:34:06 218

原创 Anti-Aliasing/Mip-NeRF/Zip-NeRF/multi-scale representation

CSDN的文章写太多,都不记得之前写的有什么了,但习惯了在这里记录,先写上吧。关于multi-scale representation又是看着忘着,还是写下点什么比较啊。时看时新,还是想吐槽自己看论文太不认真了。下面直接按照文章顺序展开介绍。

2025-08-11 21:45:43 207

原创 AAAI赶稿后的心得

这是你的文章,永远不要想着靠谁来主动找你帮你写,也不要怕麻烦别人,这本身就是互相沟通学习的过程。真的好想有一天也可以像郭老师那样,零帧起手写论文。已经第三次和老师们一起赶稿了,但是还是纰漏重重,每次都被我的垃圾写作给吓到。写一下自己的感受吧,我感觉老师们都在全力去帮我完善,奈何我真的在这个过程中交流的太少了,

2025-08-02 21:19:58 313

原创 集群上的一些东西

【代码】集群上的一些东西。

2025-07-22 17:14:14 159

原创 3DGS_means3D_means2D

我恨我这个记不住东西的垃圾脑子。

2025-05-07 13:36:59 257

原创 CVPR2025 dynamic GS

每次都看着忘着,到头来发现是自己又看过的文章,效率实在太低了,还剩几篇文章就顺带整理一下,应该一开始就弄的,哭!

2025-05-02 13:07:42 610

原创 VLLM(gemma3)部署

token自己去Huggingface注册账号申请,一次性token。困难重重,但好在国内已经存在开源网站了,在各种资料的帮助下终于。(位置大概在左上角很大一个区域)。

2025-04-16 13:03:14 1408

原创 RoMo: Robust Motion Segmentation Improves Structure from Motion

看起来像是一篇投稿CVPR的文章,不知道被哪个瞎眼审稿人拒了。同期还有一篇CVPR被接收的工作Segment Any Motion in Videos,看起来不如这篇直白(也可能是因为我先看过spotlesssplats的缘故),后面也应该一并介绍了的。总体来说:就是如何给sam2提供一个很好地prompt,获得视频序列的dynamic mask 分割结果。

2025-04-05 23:12:41 372

原创 COLMAP-Free + Segment

无位姿的GS都已经更新第二轮了,我才开始看最开始的SOTA。

2025-03-21 12:18:29 286

原创 Segment Any 4D Gaussians

直接4DGS+GS grouping存在问题: 由于存在GS漂移,所以会导致无法满足同一GS所有时刻都表示同样的物体,导致错误表示。所以作者提出,应该不同时刻的同一GS可能属于不同的类?这点我真的有点难以理解,但加入时刻t作为输入后,效果又确实变好了。那么我觉得应该思考一些,那一篇tracking文章的约束,保证高斯的移动方向要一致,是不是就可以解决漂移问题,从而再次保证不同时刻的同一GS表示同一物体?文章核心是对GS分类时要加入时间信息,但是如果GS本身就已经被区分为动静态的话,还需要这样做吗?

2025-03-05 18:20:54 196

原创 Hugging Face网络连接问题

趁着模型下载,记录一下hugging face遇到的网络连接问题,难道只有我想吐槽这个垃圾的科研环境什么时候是个头吗?hugging face到底方便了谁,又绊住了谁。到底什么时候才能没有那堵墙?感觉大家都挺坦然接受的。每次配环境面临的问题是在日本的几倍甚至几百倍。

2025-02-12 14:44:56 391

原创 Underwater 系列coding记录

load data随机选一张做它的rendering,此时开始做Gaussian splatting,输入点云、时间戳等等参数,估计Motion和GT做loss,对gaussian做剪枝整个过程还是很清晰的,接下来的任务是找到那个threshold。作者说这里的Δ\DeltaΔ是高斯相对于标准空间的位移,那么静态点到底会不会相对标准空间伪影呢,或者位移多少?在看光栅化的时候,突然反应过来一次渲染一张图啊,nerf也就是1024条光线,大一点4096条,那么这之间差了可不止几倍呢。

2025-01-23 11:17:05 410

原创 Neuralangelo代码重点部分

又是一篇新文章,最近完全没有动力搞下去,不知道是因为要放假了还是想退学,anyway,有了一点点新的idea想基于这篇文章验证一下。

2025-01-12 14:26:35 279

原创 写给自己的一些心得体会(+年终总结)

总之,不要投机取巧,不要视而不见,我想我一瞬间还是会产生些邪恶的念头,不过在想象自己站在演讲台讲述自己论文的时候心虚的样子,一切就会戛然而止。曾经我会抱怨团队,抱怨实验室没显卡,现在即使在一个完美的团队,我依然还是这样,真的全是我自己的问题,浮躁、不愿意深度思考问题,论文看得太少、表达能力太差。我时常在想我在日本的这几个月到底收获了什么,我不知道这样的生活是不是还该继续,我是不是真的没办法搞科研,我真的好希望有一天骄傲的站在演讲台上讲述自己的文章,又或许那一天永远也不会来临。

2024-10-26 15:49:01 546 1

原创 Ref-NeuS参数记录

这篇文章中的uncertainty估计非常值得参考,尤其是寻找当前view到其他view的投影点,这里记录一下这部分代码的参数,因为它起名实在太混乱了!!

2024-10-02 12:03:09 299 2

原创 Aborted (core dumped)

这里有两个值,四个pixel的avg按正常的值求出来,没有梯度;主要是怎么从中心点出发,扩大半径以求解对应的normal,这里为了不增加额外计算,就把sdf_lloss那部分不同半径同一位置计算的sdf删掉了,即: cal_sdf_loss=False,但显然这样或造成计算图不一致报错(我猜是这个原因),总之加入额外计算后就不再报错了。

2024-09-16 12:52:52 332

原创 K-Planes代码记录

原文,又要换baseline,可是效果不好能怎么办呢,我可不可以发疯。k-planes的代码又是非常工程琐碎的,大佬的代码果然不顾小白死活。随便记录下整个过程。

2024-07-01 17:02:54 850

转载 Docker常用命令记录

仓库:存放镜像的地方镜像:通过多个,可以独立运行一个或一组容器。容器的启动、停止、删除。(简易的操作系统系统)。

2024-03-29 09:20:28 123

原创 Tri-MipRF: Tri-Mip Representation for Efficient Anti-Aliasing Neural Radiance Fields

按照这个版本安装,tinycudann不在报错。(好烦啊,主页上还说要安装cu11.6,结果根本不可以)

2024-01-24 11:23:27 1162 5

原创 NeuS代码记录+nerf-W+ Multi-NeRF 报错解决方法

每天都想着早走,每天都没办法早走,真的是又气又烦,总有改不完的bug。

2023-08-13 16:49:01 1014 11

原创 nerf-studio初体验

整个安装过程非常简单,运行得也很丝滑,最大的难点在于中文资料太少,英文看得头痛。本文也是参考了许多链接,有些比我写得详细多了,各位选择性看吧。

2023-06-29 14:12:48 1479 1

原创 NeRF+SLAM论文阅读笔记

2.编码方式:one-blob(提升未观察到区域的补全能力和一致性)编码方式根据场景表示(hash网格)制定。iMap:由于实时性的要求,iMap使用系数采样和减少迭代次数提升效率,造成丢失高频细节&增大误差。1)场景表示:联合坐标+参数编码-------MLP---------->RGB和SDF。3)mapping:从所有帧采样的全局射线进行全局BA,联合优化map&pose。场景表示:如八叉树、哈希/体素网格等虽然可以提升效率,但缺乏MLP固有的。1.场景表示:多分辨率哈希网格(加速&保留高频特征)

2023-06-15 10:26:41 1963 4

原创 深度估计阅读记录

使用SDF这种表示方式替换NeRF中的MLP,使得在获得更准确的结果。我们通过的函数来实现这一点(We achieve that by modeling the volume density as a function of the geometry.)。:1. 将体密度利用公式转为SDF,使得alpha和beta是可学习的参数。其余看不懂。总之,文章的核心应该在于,从而可以将desity表示为SDF进行优化,以及实现一系列其他目的,比如:分离颜色和几何。

2023-06-08 15:07:28 891

原创 NeRF-SLAM代码记录

因为有相关依赖,所以尽量使用命令下载代码。2. 新建nerf-slam环境,github上也没提到python是哪个版本,这里就随便选了一个(这个github真的好简陋),下面这几行都是按照mip-nerf-pytorch的代码安装的3.安装torch到这一步就彻底卡住了5.编译,在执行,(以下顺序不太记得了)会出现无数个错误出现接着出现hash - r然后出现,需要进行一系列的安装接着出现以上全都安装完成后,执行以下命令,应该需要几分钟时间吧这个步骤遇到过很多奇奇怪怪的错误,以下逐一列出。

2023-05-28 22:24:44 1132 1

原创 Point-SLAM: Dense Neural Point Cloud-based SLAM阅读记录

早期的场景表示使用TSDF,之后使用可扩展(scalable)的表示方式,如:octree等,更进一步地,还可以在tracking上加入loop做改进(BundleFusion);解决noise depth maps(RoutedFusion),NeuralFusion和 DI-Fusion在此基础上进行扩展;使用RGB作为输入;优化测试时间…

2023-05-15 21:32:49 2004 1

原创 NeRF相关文章记录

当输入的位姿不准确时,也可以通过错误的位姿获得正确的建图。

2023-03-29 16:33:11 443

原创 windows跑通instant-ngp过程记录

总之先使用git命令下载一部分(这一部分也会随机报错,多尝试求好运吧),然后等子模块报错时再一个个去denpendencies下载。,需要注意的是,要跟着youtube或者b站视频来安装,视频时长20min左右。

2023-03-24 18:39:34 1760 5

原创 关于colmap+nerf对数据集进行预处理的使用总结

零零碎碎的东西太多,有必要统一记录一下,因为是回忆步骤,所以可能有不准确的地方。

2023-03-22 14:24:45 6626 6

原创 坐标系转换问题

已经是第n次写坐标系转换问题了,但是之前都是零散的写,还是需要系统总结一遍。

2023-03-14 09:48:02 712

翻译 SLAM中坐标系的转换问题

t2=[0.3,0.1,0.1]^T (q的第一项为实部。这里的q和t的表达的是Tcw,也就是世界到相机的变换关系。小萝卜二号的位姿为q2=[-0.5,0.4,-0.1,0.2],t=[-0.1,0.5,0.3]设有小萝卜一号和小萝卜二号位于世界坐标系中,小萝卜一号的位姿为:q1=[0.35,0.2,0.3,0.1],T ,求该向量在小萝卜二号坐标系下的坐标,请编程实现此事。T_1w :表示世界坐标系到小萝卜一号坐标系的变换关系。T_2w:表示世界坐标系到小萝卜二号坐标系的变换关系。

2023-02-27 20:39:29 503

翻译 SLAM数据集和评价指标

SLAM数据集

2023-02-26 09:22:47 1687

原创 NICE-SLAM: Neural Implicit Scalable Encoding for SLAM论文阅读记录

论文看到一半的时候给别人安利,突然被问起这篇文章创新点是什么,我竟然答不出来,又看了个寂寞,于是写下这篇总结。

2023-02-18 22:23:38 1891 5

原创 DSGN++记录

以上如此复杂,3D Camera转点云,对点云进行截取,再点云转图像,为什么不直接使用图像2D粘贴呢?是因为路面那里需要伪点云吗?也包括是否重合更好判断吧。可以展示出最后的增强的效果(只是单独的copy_paste策略,其他的增强方法在后续的for循环中可以看到)。7. 把图像投影至检测框的大小,使用Opencv函数视觉投影(6. 读取点云和图像,点云似乎没有用到只是添加进了列表里。后面就是字典的添加,没耐心细看了,返回一个字典。8. 将图像对应像素点替换为warp后的图像。

2022-11-22 22:12:59 791

原创 使用DSGN++训练自己的数据集

今天在看waymo数据集的时候突然发现也有灰度相机,回想了一下kitti也是灰度相机,莫非…双目相机大部分都不是全彩色?(waymo数据集需要自己去了解+下载)关于如何使用DSGN++测试waymo数据集,我大致有直接利用OpenPCDet里读取数据集的方法,生成waymo数据集下的.pkl文件,修改.yaml中数据集路径。把tfrecord中的数据全部读取出来,包括label、lidar、calib、image等,像kitti一样进行组织,再生成.pkl文件。

2022-11-18 17:17:32 986 8

原创 记录kitti数据集的坐标系转换问题

P0~P4相机内参相机外参3D相机坐标系(x,y,z,1) —>2D图像(u,v,1)世界坐标系/点云坐标系(X,Y,Z,1) —>3D相机坐标系(x,y,z,1)维度不变 3*4添加维度 3*4到4*4Tr_velo_to_cam称为外参矩阵,由旋转+平移矩阵构成,为了保证维度,需要同时对点云和矩阵进行升维。总之,就是一个内参、一个外参,一个不加维度,一个变为4*4,相应的数据也都跟着多了一维。看起来似乎很简单,但我还是看了好几天。

2022-11-07 11:50:22 3759 10

原创 ConnectionRefusedError: [Errno 111] 拒绝连接 vscode调试代码

搜索了一堆方法,不是废话就是无效。这个界面,找到冲突的端口然后关掉。

2022-10-25 21:03:18 2643

原创 mmdetection/OpenPCDet初体验

安装环境的过程很简单,参考。

2022-10-21 18:22:03 444 2

原创 指定GPU运行pytorch模型的n种方法

在Terminal终端输入(以下均以指定使用gpu1为例)或者直接。

2022-10-19 18:21:30 2169

原创 记录远程桌面连接出现Connection Problem, giving up

远程桌面连接出现黑屏或蓝屏。

2022-10-13 11:13:00 1488

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除