自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(581)
  • 资源 (9)
  • 收藏
  • 关注

转载 IMU preintegration on manifold 学习笔记(一)

Posted on 2023-02-18 Edited on 2024-07-11 In vslam Views:ω∧=[ω_1ω_2ω_3]∧=[0−ω_3ω_2ω_30−ω_1−ω_2ω_10]=WW∨=[0−ω_3ω_2ω_30−ω_1−ω_2ω_10]∨=[ω_1ω_2ω_3]=ω\mathbf{\omega}^{\wedge}=\begin{bmatrix}\omega\_1\\ \omega\_2\\ \omega\_3\end{bmatrix}^{\wedge}=\begin{bmatrix}

2024-07-12 12:10:41 35

转载 Linux中.a、.so和.o文件以及-I,-L,LIBRARY_PATH,LD_LIBRARY_PATH等

(3) 修改/etc/ld.so.conf文件,把库所在的路径加到文件末尾(直接写在文件末尾,不要在路径前加include),并执行ldconfig刷新(ldconfig 命令的用途,主要是在默认搜寻目录(/lib和/usr/lib)以及动态库配置文件/etc/ld.so.conf内所列的目录下,搜索出可共享的动态链接库(格式如前介绍,lib*.so*),进而创建出动态装入程序(ld.so)所需的连接和缓存文件.缓存文件默认为/etc/ld.so.cache,此文件保存已排好序的动态链接库名字列表.)。

2023-08-16 17:14:24 3474

原创 SLAM本质剖析番外-李群李代数的微分和导数

这几个月,博主已经从SLAM算法的使用向着算法的数学推导进行了记录和分享,之前也分享了一文,从现象中解释了李群和李代数表达的含义。但是这还不够,所以这次作者作为SLAM本质剖析的番外,来介绍李群李代数的微分和导数。

2023-01-16 16:10:19 10869 2

转载 undefined symbol问题的查找、定位与解决方法

而这块可以看到fpdf_parse_encrypt是依赖于下边的fx_crypt文件的,再看静态库,fpdf_parse_encrypt被编译成fpdfapi.a,而fx_crypt被编译进pdrm.a静态库,所以应该是fpdfapi.a要依赖于pdrm.a静态库的。ldd命令,可以查看对应的可执行文件或库文件依赖哪些库,但可执行文件或库文件要求与操作系统的编译器类型相同,即电脑是X86的GCC编译器,那么无法通过ldd命令查看ARM交叉编译器编译出来的可执行文件或库文件。

2022-12-14 14:53:39 10846 4

原创 自动驾驶-激光雷达预处理/特征提取

激光雷达作为自动驾驶最常用的传感器,经常需要使用激光雷达来做建图、定位和感知等任务。而这时候使用降低点云规模的预处理方法,可以能够去除无关区域的点以及降低点云规模。并能够给后续的PCL点云分割带来有效的收益。

2022-08-24 21:12:44 4466 2

原创 C++之生成器(builder)模式

0. 简介生成器是一种创建型设计模式, 当构建一个复杂对象时,将构建过程与表示分离。使得同样的过程创建不同的对象。生成器与其他创建型模式不同, 生成器不要求产品拥有通用接口。 这使得用相同的创建过程生成不同的产品成为可能。生成器方法通常支持方法链 (例如 someBuilder->setValueA(1)->setValueB(2)->create() ),来组成复杂的对象。相比于工厂模式专门用于生产一系列相关对象而言,生成器重点关注如何分步生成复杂对象。1. 生成器UML介绍生

2022-03-07 10:38:52 9020 2

原创 C++命名规则&书写规范

常见命名法:匈牙利命名法:基本原则是:变量名=属性+类型+对象描述\color{blue}{变量名=属性+类型+对象描述}变量名=属性+类型+对象描述,其中每一对象的名称都要求有明确含义,可以取对象名字全称或名字的一部分。命名要基于容易记忆容易理解的原则。保证名字的连贯性是非常重要的。Camel命名法:即骆驼式命名法,原因是采用该命名法的名称看起来就像骆驼的驼峰一样高低起伏。Camel命名法有两种形式:混合使用大小写字母和单词之间加下划线\color{blue}{混合使用大小写字母和单词之间加下划线}混

2021-05-12 10:42:19 5794 2

原创 从代码层面熟悉UniAD,开始学习了解端到端整体架构

最近端到端已经是越来越火了,以为代表的很多工作不断地在不断刷新端到端的指标,比如最近又重新刷新了所有任务的指标。在端到端火热起来之前,成熟的模块化自动驾驶系统被分解为不同的独立任务,例如感知、预测和规划,从而导致模块间信息丢失和错误累积。相比之下,端到端范式将多任务统一到一个完全可微分的框架中,从而允许以规划为导向进行优化。当然对于刚刚开始熟悉这一行的人来说,最简单也最值得接触的就是UniAD这各项目,这里最近受到优刻得的使用邀请,正好解决了我在大模型和自动驾驶行业对GPU的使用需求。

2024-07-25 18:10:33 346

转载 论文阅读《MapTRv2: An End-to-End Framework for Online Vectorized HD Map Construction》

高精地图提供了丰富而精确的驾驶场景静态环境信息,是自动驾驶系统规划的基础和不可或缺的组成部分。在本文中,我们提出了Map TRansformer,一个用于在线矢量化高清地图构建的端到端框架。我们提出了一种统一的等效置换建模方法,即将地图元素建模为具有一组等效置换的点集,从而准确地描述了地图元素的形状并稳定了学习过程。我们设计了一种分层查询嵌入方案,对结构化地图信息进行灵活编码,并对地图元素进行分层二部匹配学习。为了加快收敛速度,我们进一步引入了辅助的一对多匹配和稠密监督。

2024-07-25 14:35:07 11

原创 经典文献阅读之--Segment Anything Model for Road Network Graph Extraction(基于遥感影像中提取向量化的道路网络)

虽然轻地图这套方案已经被业内广泛接受并使用,但是我们发现,对于地图的依赖仍然不可或缺,只是从HD(高精地图)降到了车道级地图(LD Map)乃至标准地图(SD Map)。所以说,我们如果高效的去获取向量化的道路还是非常关键的。》一文。这是对 Segment Anything Model (SAM) [29] 的一种改进,用于从卫星图像中提取大规模、矢量化的道路网络图。为了预测图形几何结构,我们将其形式化为一个密集语义分割任务,利用了 SAM 的固有优势。

2024-07-25 10:35:50 809

原创 认识3D Gaussian Splatting以及如何和ROS结合完成实时建图

我们所知道的是高斯溅射需要预训练,然后才能完成比较好的建图,这里提出的要求就是如何预训练出比较好的参数,然后再将关键帧对应的位置作为输入,并完成3D环境的重建。这里是一个使用VINS作为输入的整体流程。高斯模型的初始化,初始化过程中加载或定义了各种相关的属性使用的球谐阶数、最大球谐阶数、各种张量(_xyz等)、优化器和其他参数。self.active_sh_degree = 0 #球谐阶数self.max_sh_degree = sh_degree #最大球谐阶数# 存储不同信息的张量(tensor)

2024-07-25 10:35:38 902

原创 经典文献阅读之--How NeRFs and 3D Gaussian Splatting are Reshaping SLAM: a Survey (NeRFs和3D高斯溅射技术如何重塑SLAM:综述

在过去的二十年中,同时定位与地图构建(SLAM)领域的研究经历了显著的演变,凸显了其在实现未知环境自主探索方面的关键作用。这一演变涵盖了从手工方法,通过深度学习时代,再到最近聚焦于神经辐射场(NeRFs)和3D高斯点(3DGS)表示的最新发展。鉴于这一领域日益增长的研究和缺乏综合性的综述,本文旨在通过最新辐射场技术的发展视角,提供SLAM进展的首个全面概述。本文阐述了SLAM的背景、进化路径、固有优势和局限性,并作为一份基础性参考,突出了该领域的动态进展和具体挑战。图1:SLAM演变时间轴。

2024-07-25 10:35:15 1049

原创 经典文献阅读之--GraphAD(端到端自动驾驶的交互场景图)

对自车、道路参与者和地图元素之间复杂交互的建模一直是确保安全的自动驾驶的关键部分。之前关于端到端自动驾驶的研究依赖于注意力机制来处理异构交互,但这种方法未能捕捉几何先验,并且计算量巨大。在《》中,我们提出了交互场景图(ISG)作为一种统一的方法来建模自车、道路参与者和地图元素之间的交互。通过ISG的表示,驾驶代理可以从最具影响力的元素中聚合关键信息,包括潜在碰撞的道路参与者和需要遵循的地图元素。由于省略了大量不必要的交互,更高效的基于场景图的框架能够专注于不可或缺的连接,从而带来更好的性能。

2024-07-25 10:34:34 900

原创 一文梳理自监督学习以及最火的端到端自动驾驶

特斯拉的FSD带火了自监督学习,而GPT这类大模型也使用了自监督学习的理念。众所周知,监督学习的成本过于高昂,尤其在任务复杂时,典型的就是FSD这样的系统。特斯拉收集的训练数据已经超出4亿公里,这些数据如果没有“自动标注系统”的帮助,根本无法用于训练。

2024-07-25 10:34:14 504

原创 经典文献阅读之--Diffusion Model-Based Image Editing: A Survey(基于扩散模型的图像编辑)

去噪扩散模型已经成为各类图像生成和编辑任务的强大工具,这种方法无论是在无需先验输入条件下还是在基于输入的条件下,都能够高效地合成视觉内容。这一技术的核心理念在于,通过学习逆向操作——即逐步为图像添加噪声的过程,从而使其能够从复杂的分布中生成高质量的样本。在本次综述《》中,我们全面回顾了利用扩散模型进行图像编辑的现有技术,详细探讨了该领域内的理论与实践方面。我们从多个维度对这些方法进行了详尽的分析和分类,涉及学习策略、用户输入条件,以及能够实现的特定编辑任务等方面。

2024-07-25 10:33:58 985

转载 基于BEVDET剖析MMDet3D框架

MMDet3D 官方文档MMDet3D官方仓库MMDet3D支持**_SUN RGB-D_**,_ScanNet__nuScenes_, **_Lyft_和_KITTI_**共5个主流数据集。对于上述数据集之外的公开数据集或者自定义数据集,可以通过继承 Custom3DDataset 来实现新的数据集类,并重载相关的方法,如 BEVDETNuScenesDataset数据集所示,该文件位于/mmdet3d/datasets/bevdet_nuscenes_dataset.py。

2024-07-24 13:17:33 11

原创 经典文献阅读之--LIV-GaussMap(实时3D辐射场地图渲染的LiDAR惯性视觉融合算法)

介绍了一种集成的精确激光雷达、惯性和视觉(LIV)多模态传感器融合映射系统,该系统基于可微表面散斑技术,提高了映射的保真度、质量和结构准确性。值得注意的是,这也是一种用于激光雷达-视觉-惯性传感器融合的紧密耦合映射的新形式。该系统利用激光雷达和视觉数据的互补特性,捕获大规模三维场景的几何结构,并以高保真度恢复其视觉表面信息。使用激光雷达-惯性系统并采用尺寸自适应体素获得表面高斯场景的初始姿态。然后,我们通过视觉导出的光度梯度对高斯进行优化和精细化,以优化激光雷达测量的质量和密度。

2024-07-24 11:41:13 1522

原创 经典文献阅读之--World Models for Autonomous Driving(自动驾驶的世界模型:综述)

在自动驾驶的快速发展领域中,准确预测未来事件及评估其含义的能力对于安全性和效率至关重要,这对决策过程至关重要。世界模型作为一种变革性方法出现,使自动驾驶系统能够合成和解释大量传感器数据,从而预测潜在的未来场景并弥补信息缺口。》提供了对自动驾驶中世界模型当前状态和未来进展的初步回顾,涵盖了它们的理论基础、实际应用以及旨在克服现有限制的持续研究努力。突出了世界模型在推进自动驾驶技术中的重要作用,本调查旨在为研究社区提供一个基础参考,便于迅速获取和理解这一新兴领域,并激发持续的创新和探索。

2024-07-24 11:40:47 1243

转载 经典文献阅读之--MapLocNet(实现自动驾驶新突破,告别GPS的亚米级定位)

上述实验结果表明,从俯视图的角度来看,节点、建筑物和车道的学习难度逐步降低,而它们在环境中的组成比例逐步增加,因此它们在定位中的重要性也逐步增加。BEV空间中的自车感知范围被定义为[−64m,64m,0.5mpp]的纵向轴和[−32m,32m,0.5mpp]的横向轴,深度分布的bins范围为[4m,60m,1mpp]。地图编码阶段,使用VGG-16主干来编码地图特征,与BEV模块类似,在地图解码器的不同阶段,也提取了粗细两层级地图特征,用于后续的层级特征配准。这些要素的空间排列为定位提供了重要的几何约束。

2024-07-15 16:44:09 518

原创 Autoware 定位之localization工具(七)

这一讲按照《Autoware 技术代码解读(三)》梳理的顺序,我们来说一说Autoware中定位的工具以及error诊断,这一章还是比较简单的,里面的内容也比较清晰。

2024-07-15 15:59:20 1789

转载 激光雷达常见点云异常场景分析

Yole在2023年8月的报告中,统计了从2018年到2022年,在全球范围内激光雷达累计定点车型。其中,以国别区分的分布如下。中国占据了全球车用激光雷达市场的79%,是最大的车用激光雷达市场。图片来源:Yole以速腾、禾赛、华为、图达通等优秀的中国公司的激光雷达产品,占据了绝大部分市场份额。禾赛和速腾刚刚发布的今年Q1的销量如下:图片来源:禾赛、速腾本文描述的很多弱势场景问题,在我们很多公司的产品中都有非常好的应对方案。

2024-07-15 15:57:54 949

转载 经典文献阅读之--DTCLMapper(双重时间一致性学习用于矢量化高清地图构建)

本文详细介绍了DTCLMapper框架,它由两个核心模块组成:实例一致性学习(ICL)和地图一致性学习(MCL)。ICL模块通过矢量点预选和聚合实例特征一致性学习,强化了实例特征在时间维度上的一致性。而MCL模块则通过全局的几何和状态一致性约束,确保了地图的整体一致性和泛化能力。这两个模块的协同作用显著提高了矢量化高精地图的构建精度和质量。作者计划进一步优化和扩展DTCLMapper框架,以适应更复杂的驾驶环境和处理更大规模的数据集。

2024-07-15 15:37:02 905

原创 Autoware 定位之基于ARTag的landmark定位(六)

这一讲按照《Autoware 技术代码解读(三)》梳理的顺序,我们来说一说Autoware中基于地标的定位,这里的地标可以是:相机检测到的AR标签,还可以是通过LiDAR检测到的强度特征的板块。由于这些地标易于检测和估计姿态,如果地图上预先标注了地标的姿态,那么可以从检测到的地标的姿态计算出自我姿态。该代码实现了一个基于ArUco标记的定位器节点,其中包含了构造函数和设置节点参数、日志记录、tf变换、图像传输、订阅者和发布者等功能。设置函数setup()用于初始化节点参数、日志记录、tf变换、图像传输、订阅

2024-07-13 14:02:27 2338

原创 经典文献阅读之--DriveVLM(自动驾驶与大型视觉语言模型的融合)

本文介绍了DriveVLM:自动驾驶与大型视觉语言模型的融合。城市环境中自动驾驶的一个主要障碍是理解复杂且长尾的场景,例如具有挑战性的路况和微妙的人类行为。为此,本文引入了DriveVLM,这是一种利用视觉语言模型(VLMs)增强场景理解和规划能力的自动驾驶系统。DriveVLM集成了用于场景描述、场景分析和分层规划的思维链(CoT)模块的独特组合。

2024-07-13 14:01:41 2106

原创 经典文献阅读之--Self-Supervised Bird’s Eye View Motion,,(基于跨模态信号的自监督鸟瞰图运动预测)

本文介绍了基于跨模态信号的自监督鸟瞰图运动预测。以自监督的方式学习密集鸟瞰图(BEV)运动流是机器人和自动驾驶的一项新兴研究。目前的自监督方法主要依赖于点云之间的点对应关系,这可能会引入假的运动流和不一致的问题,阻碍了模型学习准确且现实的运动的能力。在本文中,我们引入一种新型的跨模态自监督训练框架,该框架通过利用多模态数据来获得监督信号,有效地解决了这些问题。》一文设计了三种创新的监督信号来保留场景运动的固有性质,包括masked倒角距离损失、分段刚性损失和时间一致性损失。相关代码可以在Github中找到。

2024-07-11 14:03:22 2217

原创 经典文献阅读之--DEviLOG(使用合成数据和真实世界数据的数据驱动占用网格映射基于Transformer的BEV方案量产方案)

在自动驾驶汽车(AV)的感知任务中,数据驱动的方法往往优于传统方法。这促使我们开发了一种基于数据的方法来从激光雷达测量中计算占用网格地图(OGM)。我们的方法扩展了之前的工作,使得估计的环境表示现在包含一个额外的层,用于标记被动态物体占据的单元格。早期的解决方案只能区分自由和占用的单元格。障碍物是否可以移动的信息对于规划AV的行为非常重要。》提出了两种生成训练数据的方法。一种方法扩展了我们以前关于使用合成训练数据的工作,以便生成具有上述三种单元状态的OGM。

2024-07-11 14:01:56 1941

转载 【SchurVINS】一种基于滤波的轻量视觉惯性导航系统

准确度和计算效率往往是用来评估视觉惯性导航系统的两大指标,目前现有的大部分VINS系统要么精度高,计算量却很大;要么计算量低,但是精度也很低。因此很难在资源受限的系统上提供准确的定位,为了解决这个问题,本文提出了SchurVINS,一种基于滤波的视觉惯性系统,综合考量了视觉残差,同时通过Schur操作降低计算复杂度,使得精度和效率的得到了良好的平衡,并在Euroc和TUM-VI数据集上做了充分的实验,和最先进的算法进行了比较,表现十分优异。

2024-07-09 17:52:24 1493

原创 经典文献阅读之--WidthFormer(基于Transformer的BEV方案量产方案)

提出了WidthFormer,这是一种基于Transformer的新颖鸟瞰视角(Bird’s-Eye-View, BEV)三维检测方法,专为实时自动驾驶应用而设计。WidthFormer在计算上高效、稳健,且无需特殊的工程努力即可部署。我们提出了一种新颖的三维位置编码机制,能够准确地封装三维几何信息,使得我们的模型仅通过一个Transformer解码层就能生成高质量的BEV表示。这种机制对现有的稀疏三维对象检测器也是有益的。受到最近提出的工作的启发,我们进一步通过垂直压缩图像特征。

2024-07-03 10:25:03 3118

原创 激光SLAM如何动态管理关键帧和地图

个人在想在长期执行的SLAM程序时,当场景发生替换时,激光SLAM如何有效的更新或者替换地图是非常关键的。在看了很多Life-Long的文章后,个人觉得可以按照以下思路去做。这里可以给大家分享一下。

2024-07-03 10:17:31 3316

原创 经典文献阅读之--iDet3D(交互式3D目标检测器)

在激光雷达场景中准确标注多个3D物体是费时且具有挑战性的工作。虽然之前有一些研究尝试利用半自动方法进行成本效益高的包围盒标注,但这些方法在有效处理大量多类别物体时存在局限。为了有效加速3D标注流程,《》提出了iDet3D,一个高效的交互式3D物体检测器。iDet3D支持用户友好的2D界面,该界面可以减轻用户在3D空间中进行点击交互的认知负担,使用户能够通过最少的交互完成每个场景中全部物体的标注。考虑到3D点云的稀疏性,我们设计了一种负点击模拟(NCS)机制来提高准确性,通过减少误报预测。

2024-07-01 18:45:20 3328

原创 经典文献阅读之--MobileViT(轻量级、通用且移动友好的网络框架)

轻量级卷积神经网络(CNNs)已成为移动视觉任务的标准选择。它们的空间归纳偏置使得它们能在各种视觉任务中通过较少的参数学习表示。然而,这些网络在空间上具有局部性。为了学习全局性表示,人们开始采用基于自注意力机制的视觉Transformer(ViTs)。不同于CNNs,ViTs模型较大。在《》文中,我们探讨了这样一个问题:是否可以结合CNNs和ViTs的优点,为移动视觉任务构建一个轻量级且延迟低的网络?为此,我们介绍了MobileViT,一种适用于移动设备的轻量级和通用视觉Transformer。

2024-06-26 16:54:13 4353

原创 Autoware 定位之GEO坐标转换与带有IMU的里程计(五)

我们在上一篇中给我们的定位开了一个头,下面我们继续按照按照《Autoware 技术代码解读(三)》梳理的顺序,我们一个个慢慢来看与学习。这一讲我们来看GEO坐标转换与带有IMU的里程计。

2024-06-25 17:09:16 4010

原创 Ubuntu20.04安装LibTorch并完成高斯溅射环境搭建

选择包含稀疏点的COLMAP、OpenSfM、ODM或nerfstudio项目路径。

2024-06-25 11:34:55 5153

转载 经典文献阅读之--BTC(解决点云密度不均、视角变换的问题)

BTC是一种用于3D点云的地点识别,新的二进制和三角形结合描述子。三角形描述子负责全局描述;二进制描述子负责局部。三角形描述子通过三个关键点的边长捕捉点云的全局外观,并提供了旋转和平移不变性,同时二进制描述子编码了每个关键点的局部几何信息,增强了描述子的描述性和辨别力。未来方向进一步优化BTC描述子的计算效率探索其在其他应用场景中的潜力。

2024-06-19 15:55:32 3529

原创 经典文献阅读之--FlashOcc(快速且内存高效的占用预测模块)

鉴于能够缓解 3D 目标检测中普遍存在的长尾缺陷和复杂形状缺失的能力,占用预测已成为自动驾驶系统的关键组成部分。然而,三维体素级表示的处理不可避免地会在内存和计算方面引入大量开销,阻碍了迄今为止的占用预测方法的部署。与使模型变得更大、更复杂的趋势相反,《》认为理想的框架应该对不同的芯片进行部署友好,同时保持高精度。为此,本文提出了一种即插即用范例,即FlashOCC,以巩固快速且节省内存的占用预测,同时保持高精度。特别是,本文的 FlashOCC 基于当代体素级占用预测方法做出了两项改进。首先,

2024-06-11 18:33:03 7307

原创 RAG与知识库搭建

自从发现可以利用自有数据来增强大语言模型(LLM)的能力以来,如何将 LLM 的通用知识与个人数据有效结合一直是热门话题。关于使用微调(fine-tuning)还是检索增强生成(RAG)来实现这一目标的讨论持续不断。检索增强生成 (RAG) 是一种使用来自私有或专有数据源的信息来辅助文本生成的技术。它将检索模型(设计用于搜索大型数据集或知识库)和生成模型(例如大型语言模型 (LLM),此类模型会使用检索到的信息生成可供阅读的文本回复)结合在一起。

2024-06-11 18:32:41 7877

原创 Autoware 定位之EKF 滤波定位(四)

对于AutoWare,我们已经讲了很多了,从这一篇我们开始进入实战,按照《Autoware 技术代码解读(三)》梳理的顺序,我们一个个慢慢来看与学习,首先第一个就是基于ekf的滤波定位。扩展卡尔曼滤波定位器通过将二维车辆动力学模型与输入的自我姿态和自我扭矩信息进行整合,估计出鲁棒且噪音较小的机器人姿态和扭矩。

2024-06-11 18:31:48 7714

原创 经典文献阅读之--P2O-Calib(利用点对空间遮挡关系的相机-激光雷达标定)

本文介绍了《》:利用点对空间遮挡关系的相机-激光雷达标定。传感器精确且鲁棒的标定结果被认为是自动驾驶和机器人领域中后续研究的一个重要组成部分。目前涉及3D激光雷达和单目相机之间外参标定的工作主要着重于基于目标和无目标的方法。基于目标的方法通常由于限制(例如额外的目标设计和目标放置限制)而离线使用。目前的无目标方法在各种环境中均存在特征不确定性和特征误匹配的问题。为了缓解这些限制,本文提出了一种新型的基于2D-3D边缘点提取的无目标标定方法,其使用3D空间中的遮挡关系。

2024-06-09 12:40:58 7651

原创 经典文献阅读之--MGS-SLAM(单目稀疏跟踪和高斯映射与深度平滑正则化)

本文介绍了一种基于高斯喷洒的密集视觉同时定位与地图构建(VSLAM)新框架。最近基于高斯喷洒的SLAM取得了有希望的结果,但依赖于RGB-D输入且在跟踪方面较弱。为了解决这些局限性,《》首次独特地将先进的稀疏视觉里程计与密集高斯喷洒场景表示相结合,从而消除了基于高斯喷洒的SLAM系统对深度图的依赖并增强了跟踪的鲁棒性。在这里,稀疏视觉里程计在RGB流中跟踪相机姿态,而高斯喷洒负责地图重建。这些组件通过多视图立体(MVS)深度估计网络相互连接。我们提出了一种深度平滑损失,以减少估计深度图的负面影响。

2024-06-07 17:24:38 7661

原创 如何使用共享GPU平台搭建LLAMA3环境(LLaMA-Factory)

最近受到优刻得的使用邀请,正好解决了我在大模型和自动驾驶行业对GOU的使用需求。UCloud云计算旗下的的GPU算力云平台。他们提供高性价比的4090 GPU,按时收费每卡2.6元,月卡只需要1.7元每小时,并附带200G的免费磁盘空间。暂时已经满足我的使用需求了,同时支持访问加速,独立IP等功能,能够更快的完成项目搭建。而且在使用后可以写对应的博客,可以完成500元的赠金,完全可以满足个人对GPU的需求。

2024-06-04 20:48:41 8402 2

各学科重要国际学术会议目录.pdf

各学科重要国际学术会议目录,可以知道自己所投会议影响力

2022-01-07

ROS 导航功能调优指南∗.pdf

ROS 导航功能包用于实现移动机器人可靠移动。ROS 导航功能包通过处理里程数据、传 感器数据和环境地图数据,为机器人运动生成一条安全的路径。最大限度地优化导航功能包 的性能需要对相关参数进行调整,且调参这项工作并不像表面上的那么简单。对其中的概念和推理不熟悉的人很大概率会采用随机尝试的策略,无形中浪费了大量时间。

2022-01-07

ROS2相关资源.pdf

一本ROS2相关的资料整合,非常适合初学者学习

2022-01-07

ROS_One.zip

ROS QT交互软件,打开即用

2021-04-13

占据栅格地图构建分享.zip

Gmapping的地图构建部分

2021-04-12

kuka代码.zip

基于ros的KUKA iiwa700机器人控制操作,已提供说明文档,有问题可以咨询

2021-02-26

机械臂项目kuka_iiwa.zip

本资源主要是KUKA_iiwa强化学习仿真,利用强化学习实现机械臂的抓取,并附有详细的代码注释。

2020-04-30

小觅摄像头Opencv处理

小觅摄像头Opencv处理,https://blog.csdn.net/lovely_yoshino/article/details/94859666实现过程

2019-07-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除