huarzail-CSDN博客

原创 SUNDAE-一种称为“光谱剪枝”的技术来优化和压缩3DGS模型

3DGS虽然渲染速度快，但是使用显式场景表达，所以大场景下的内存占用大，很难在边缘设备使用。SUNDAE通过一种称为“光谱剪枝”的技术来优化和压缩3D高斯溅射（3D Gaussian Splatting，简称3DGS）模型，同时使用神经网络补偿来保持渲染质量。

2024-05-18 16:36:44 631

原创 SuperPoint：Weights File and Demo Script

SuperPoint预训练网络是一个开源项目，由Magic Leap Research团队开发。此项目提供了一种高效且准确的关键点检测和描述子提取算法，旨在改进各种视觉任务的性能，如图像配准、3D重建和物体识别等。

2024-04-23 15:25:20 580

原创 SVD奇异值分解原理及应用

SVD是推荐系统的基础，而推荐系统是谷歌，YouTube，亚马逊，Facebook等大公司的核心。

2024-04-21 19:32:18 959 1

原创深度图转点云

视差转点云，看似简单，但是要了解其中的原理，就需要细致的分析其中的数学推导。

2024-04-17 13:00:32 641

GO-SLAM是ICCV 2023的优秀开源的SLAM文章。GO-SLAM是基于深度学习的密集视觉SLAM框架，实现了对姿势和三维重建的实时全局优化。通过整合强健的姿势估计、高效的闭环检测以及持续表面表示更新，GO-SLAM有效地解决了与神经隐式表示相关的误差累积和畸变挑战。通过利用输入历史中学习到的全局几何信息，GO-SLAM在合成和真实世界数据集上设定了新的跟踪鲁棒性和重建准确性标准。其灵活性涵盖了单目、立体和RGB-D输入。

2024-03-13 10:41:36 1327 4

原创 Gaussian Splatting SLAM（MonoGS）项目实践

Gaussian Splatting SLAM首次将3DGS用到SLAM中（基于单目或RGB-D），当然了相比GS-SLAM和SplaTAM两个工作都是RGBD的，这个工作确实是第一个实现是单目场景的3DGS-SLAM。而所设计的SLAM方法以3fps实时运行，利用高斯体作为唯一的3D表示，3D Gaussian 场景表示与camera pose一同联合优化。

2024-03-06 10:25:48 1542 8

原创 SplaTAM项目实践

SplaTAM应该是第一个基于3D Gaussian Splatting的SLAM系统。

2024-02-28 16:41:52 2286 9

原创 Point-SLAM 项目实践

point-slam是一个非常优秀的slam开源框架。

2024-02-28 16:34:48 1012 2

原创 vMAP项目介绍

vMAP 是一种基于神经场（NeRF）的对象级密集 SLAM 系统，可根据 RGB-D 输入流实时自动构建对象级场景模型。每个对象都由一个单独的 MLP 神经场模型表示，无需 3D 先验即可实现高效、无懈可击的对象建模。该系统可以在单个场景中优化多达 50 个单独的对象，与之前的神经场 SLAM 系统相比，可以显着提高场景级和对象级的重建质量。

2024-01-20 20:06:58 858

原创 UnDeepVO: Monocular Visual Odometry through Unsupervised Deep Learning

对于单目VISO2-M和没有环路闭合的ORB-SLAM，它们无法使用我们的输入设置（图像分辨率416×128），因此我们提供了这两个系统在高分辨率1242×376下的结果。图1展示了系统概述。我们的UnDeepVO的一个特点是恢复6自由度姿态和深度的绝对尺度，这要归功于我们的训练方案，如图3所示。然后，我们使用输入的立体图像、估计的深度图像和6自由度姿态构建损失函数，考虑立体相机组的几何关系。在过去的几十年里，基于模型的VO或几何VO得到了广泛研究，其两种范式，基于特征的方法和直接方法，都取得了巨大成功。

2023-08-29 18:02:37 193 1

原创 Orbeez-SLAM: A Real-time Monocular Visual SLAMwith ORB Features and NeRF-realized Mapping

在本研究中，我们开发了一种名为Orbeez-SLAM的视觉SLAM系统，它成功地将隐式神经表示和视觉里程计相结合，实现了我们的目标。此外，Orbeez-SLAM可以使用单目相机，因为它只需要RGB输入，使其在现实世界中具有广泛的应用。实验结果显示，我们的SLAM系统比强基线系统快800倍，并且渲染结果更优。

2023-08-05 15:41:46 35

原创 Stereo Visual Simultaneous Localization and Mapping

多伦多大学航空航天研究所在2020年公开的额双目SLAM数据集

2023-07-30 19:06:27 153 1

原创 DeepVO项目实践-基于ChiWeiHsiao/DeepVO-pytorch版本

DeepVO方法应该是第一个采用LSTM方法来实现视觉里程计的方法，具有里程碑的意义。由于作者没有开源，感谢很多大佬复现了他的方法，如ChiWeiHsiao复现了DeepVO方法，github上取名为：DeepVO-pytorch。本文对DeepVO-pytorch的部署进行了简单介绍。

2023-07-17 19:05:44 608 8

原创 DeepVO：通过深度循环卷积神经网络实现端到端的视觉里程计

使用深度递归卷积神经网络(RCNNG)，提出了一种新颖的端到端单目VO的框架。由于它是以端到端的方式进行训练和配置的，因此它可以直接从一系列原始的RGB图像（视频）中计算得到姿态，而无需采用任何传统VO框架中的模块。

2023-07-16 18:23:03 981 2

原创语义分割、实例分割、全景分割的区别（Semantic vs. Instance vs. Panoptic Segmentation）

图像分割是一种计算机视觉和图像处理技术，涉及在像素级别上对图像中的相似区域或片段进行分组或标记。

2023-07-15 16:17:34 4479 2

原创 DROID-SLAM工程项目实践

DROID-SLAM是一个非常优秀的端到端VSLAM系统，值得认真理解。

2023-06-02 13:36:25 971 6

原创 VSLAM-TartanAir数据集介绍

TartanAir，用于机器人导航任务以及其他任务。这些数据是在逼真的模拟环境中收集的，考虑了各种光照条件、天气和移动物体的存在。

2023-05-28 20:51:49 1004 2

原创 CVPR2023-PVO(Panoptic Visual Odometry)项目安装详解

PVO将视觉里程计（VO）和视频全景分割（VPS）统一起来，使得这两个任务相互受益。具体而言，我们在VO模块中引入了一个全景更新模块，并结合图像全景分割的指导。这个全景增强的VO模块可以通过全景感知的动态掩蔽器减轻相机位姿估计中动态物体的影响。另一方面，VO增强的VPS模块通过将当前帧的全景分割结果实时融合到相邻帧中，利用从VO模块获得的相机位姿、深度和光流等几何信息来提高分割精度。这两个模块通过循环迭代优化相互促进。

2023-05-26 20:47:27 46 1

原创文献阅读-VO（CVPR2023）PVO: Panoptic Visual Odometry

PVO，一种新颖的全景视觉里程计框架，旨在实现对场景运动、几何和全景分割信息更全面的建模。

2023-05-14 15:30:40 941

原创视觉slam十四讲ch5 5.4 实践：拼接点云

视觉slam十四讲ch5 5.4 实践：拼接点云实现

2023-04-08 10:10:47 1038

原创 Turtlebot3+Cartographer配置运行

TurtleBot3是一个小型、低成本、可编程的基于ROS的移动机器人,其目的是用于教育、科研、爱好者作品和产品原型。Cartographer是google在2016年开源的SLAM算法，受到许多工程师的喜爱，这两者结合仿真，具有很好的研究价值和意义。

2023-03-24 14:55:24 2651

原创 Cartographer目录结构

Cartographer是 Google 开源的一个 ROS 系统支持的 2D 和 3D SLAM库。了解其源代码目录结构，可以更好的学习SLAM。

2023-03-06 15:48:37 234

原创双目立体视觉中基于深度学习的Cost Volume浅析（difference方式）

深入了解双目立体视觉中基于深度学习的Cost Volume构建方式，对于Stereo Match研究具有重要意义。

2022-11-29 12:00:34 1166

转载 ZedBoard的第一个工程Helloworld

一、配置硬件信息启动PlanAhead，进入新建工程向导选择工程名和路径工程类型，这里选择 RTL 工程由于只需要PS部分信息，而这部分在后面由XPS完成，因而不需要添加任何文件一直点下一步，直道出现芯片和板载信息。直接选择Boards，选择系列是Zynq-7000。14.1目前只支持XC7Z020器件。完成新

2014-04-10 17:00:30 739

huarzail的专栏