自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(589)
  • 资源 (9)
  • 收藏
  • 关注

转载 IMU preintegration on manifold 学习笔记(一)

Posted on 2023-02-18 Edited on 2024-07-11 In vslam Views:ω∧=[ω_1ω_2ω_3]∧=[0−ω_3ω_2ω_30−ω_1−ω_2ω_10]=WW∨=[0−ω_3ω_2ω_30−ω_1−ω_2ω_10]∨=[ω_1ω_2ω_3]=ω\mathbf{\omega}^{\wedge}=\begin{bmatrix}\omega\_1\\ \omega\_2\\ \omega\_3\end{bmatrix}^{\wedge}=\begin{bmatrix}

2024-07-12 12:10:41 316

转载 Linux中.a、.so和.o文件以及-I,-L,LIBRARY_PATH,LD_LIBRARY_PATH等

(3) 修改/etc/ld.so.conf文件,把库所在的路径加到文件末尾(直接写在文件末尾,不要在路径前加include),并执行ldconfig刷新(ldconfig 命令的用途,主要是在默认搜寻目录(/lib和/usr/lib)以及动态库配置文件/etc/ld.so.conf内所列的目录下,搜索出可共享的动态链接库(格式如前介绍,lib*.so*),进而创建出动态装入程序(ld.so)所需的连接和缓存文件.缓存文件默认为/etc/ld.so.cache,此文件保存已排好序的动态链接库名字列表.)。

2023-08-16 17:14:24 3514

原创 SLAM本质剖析番外-李群李代数的微分和导数

这几个月,博主已经从SLAM算法的使用向着算法的数学推导进行了记录和分享,之前也分享了一文,从现象中解释了李群和李代数表达的含义。但是这还不够,所以这次作者作为SLAM本质剖析的番外,来介绍李群李代数的微分和导数。

2023-01-16 16:10:19 10891 2

转载 undefined symbol问题的查找、定位与解决方法

而这块可以看到fpdf_parse_encrypt是依赖于下边的fx_crypt文件的,再看静态库,fpdf_parse_encrypt被编译成fpdfapi.a,而fx_crypt被编译进pdrm.a静态库,所以应该是fpdfapi.a要依赖于pdrm.a静态库的。ldd命令,可以查看对应的可执行文件或库文件依赖哪些库,但可执行文件或库文件要求与操作系统的编译器类型相同,即电脑是X86的GCC编译器,那么无法通过ldd命令查看ARM交叉编译器编译出来的可执行文件或库文件。

2022-12-14 14:53:39 10967 4

原创 自动驾驶-激光雷达预处理/特征提取

激光雷达作为自动驾驶最常用的传感器,经常需要使用激光雷达来做建图、定位和感知等任务。而这时候使用降低点云规模的预处理方法,可以能够去除无关区域的点以及降低点云规模。并能够给后续的PCL点云分割带来有效的收益。

2022-08-24 21:12:44 4489 2

原创 C++之生成器(builder)模式

0. 简介生成器是一种创建型设计模式, 当构建一个复杂对象时,将构建过程与表示分离。使得同样的过程创建不同的对象。生成器与其他创建型模式不同, 生成器不要求产品拥有通用接口。 这使得用相同的创建过程生成不同的产品成为可能。生成器方法通常支持方法链 (例如 someBuilder->setValueA(1)->setValueB(2)->create() ),来组成复杂的对象。相比于工厂模式专门用于生产一系列相关对象而言,生成器重点关注如何分步生成复杂对象。1. 生成器UML介绍生

2022-03-07 10:38:52 9074 2

原创 C++命名规则&书写规范

常见命名法:匈牙利命名法:基本原则是:变量名=属性+类型+对象描述\color{blue}{变量名=属性+类型+对象描述}变量名=属性+类型+对象描述,其中每一对象的名称都要求有明确含义,可以取对象名字全称或名字的一部分。命名要基于容易记忆容易理解的原则。保证名字的连贯性是非常重要的。Camel命名法:即骆驼式命名法,原因是采用该命名法的名称看起来就像骆驼的驼峰一样高低起伏。Camel命名法有两种形式:混合使用大小写字母和单词之间加下划线\color{blue}{混合使用大小写字母和单词之间加下划线}混

2021-05-12 10:42:19 5837 2

转载 MapTR调试记录

最近在研究maptr,因为代码实在复杂,不记录一下很容易就忘记,因此来开个坑写一写自己的研究历程。经过上面的步骤,基本疏通了maptr的训练步骤,但是里面存在许多细节,由于还在看源码,以及有一些问题还没解决,后续的详解版本会对代码里面的变量进行详细注解(已经在写了,如果没啥问题的话),维度以及作用,一方面是加深对maptr的理解,另一方面提高自己对mmlab类模型的认知。本文转自defaultv43,如有侵权,请联系删除。

2024-08-21 17:29:45 8

转载 TensorRT:onnx parser与onnx-graphsurgeon的解析与实践

欢迎阅读本篇博客《TensorRT:onnx parser与onnx-graphsurgeon的解析与实践》!在如今深度学习领域的快速发展中,模型的部署和优化变得越来越重要。TensorRT作为一种高性能推理引擎,为我们提供了优化和加速深度学习模型的能力。而在TensorRT中,和则是两个强大的工具,能够帮助我们更好地解析和优化ONNX模型。本博客将分为三个章节进行介绍。首先,我们将深入探讨,它是TensorRT中用于解析ONNX格式模型的重要组件。我们将详细介绍ONNX parser的原理和使用方法,帮助

2024-08-19 20:33:07 354

转载 自动驾驶迭代过程:规则驱动→数据驱动→数据+知识驱动

这些规则通常基于对交通规则、道路条件、车辆行为等的深入理解。通过规则指导驾驶:系统使用。

2024-08-19 13:30:25 369

原创 从BEVDET来学习如何生成trt以及如何去写这些C++内容

对于深度学习而言,通过模型加速来嵌入进C++是非常有意义的,因为本身训练出来的文件其实效率比较低下,所以这里我们将以BEVDET作为例子,来向读者展示如何去生成trt,并完善engine加速。这里最近受到优刻得的使用邀请,正好解决了我在大模型和自动驾驶行业对GPU的使用需求。UCloud云计算旗下的Compshare的GPU算力云平台。他们提供高性价比的4090 GPU,按时收费每卡2.08元,月卡只需要1.36元每小时,并附带200G的免费磁盘空间。暂时已经满足我的使用需求了,同时支持访问加速,独立IP等

2024-08-09 19:53:54 3284

转载 驭势科技LiDAR在线定位系统:如何实时检测道路标记并做语义匹配?

基于 LiDAR 的路标检测被广泛应用于高精地图的生成,但这些方法通常是离线处理的,处理密集点云数据非常耗时,因此不适用于实时环境感知和定位。现有研究中的实时感知方法通常通过阈值化单次 LiDAR 扫描中的测量强度来检测路标。然而,单次扫描方法在检测完整的路标时面临挑战,因为 LiDAR 测量点的稀疏性使得检测结果容易受到噪声影响,缺乏鲁棒性。一些研究通过累积多次扫描帧的路面点,并应用固定强度阈值来隔离路标点,这种方法提高了定位精度,但对环境条件和传感器类型变化的敏感性较高。深度学习方法在路标检测任务中被广

2024-08-01 15:36:11 1571

转载 经典文献阅读之--BLOS-BEV(打破感知边界,检测距离达200米)

鸟瞰图表示(Bird’s-eye-view, BEV)对于自动驾驶中的感知任务尤为重要。平衡BEV表示的准确性、效率和范围是非常困难的。现有的工作通常将感知范围限制在50米以内。扩展BEV表示的范围可以通过提供更全面的信息和反应时间,大大有利于下游任务,如拓扑推理、场景理解和规划。标准定义(SD)导航地图可以提供道路结构拓扑的轻量级表示,具有获取方便和维护成本低的特点。为了充分利用SD地图信息,作者将车载摄像头的近距离视觉信息与SD地图的视线外(BLOS)环境先验结合,以实现扩展的感知能力。

2024-08-01 10:57:20 1896

转载 经典文献阅读之--VIPS-Odom(首个将车位显式融合到前后端的紧耦合VIO框架)

VIPS-Odom是一种新颖的紧耦合 SLAM 系统,融合了惯性测量单元、轮速传感器和四个环视鱼眼摄像头的测量数据,实现了高精度且稳定的定位。其实时检测 BEV 图像中的停车位,可靠地维护观察到的停车位状态,并同时将停车位观察结果作为前端视觉特征和后端优化因子,提升定位精度。该方法还开发了一个相关传感器套件的实验平台,用于评估 VIPS-Odom 的性能。覆盖短距离和长距离停车场景的大量现实世界实验反映了相对于其他基准方法的有效性和稳定性。改进点尚未将闭环检测模块纳入系统。

2024-07-29 18:35:32 2150

转载 经典文献阅读之--Detecting Road Obstacles by Erasing Them(通过消除法检测道路障碍物)

车辆在道路上可能会遇到无数的障碍物,而且事先记录下它们以训练一个检测器是不可能的。相反,我们选择图像块,并使用周围的道路纹理进行填充,这倾向于从这些块中移除障碍物。然后,我们使用一个训练有素的网络来识别原始块和填充后的块之间的差异,这标志着擦除了一个障碍物。》解决了这个问题,并在上有对应的工作链接。

2024-07-29 18:10:25 2075

原创 从代码层面熟悉UniAD,开始学习了解端到端整体架构

最近端到端已经是越来越火了,以为代表的很多工作不断地在不断刷新端到端的指标,比如最近又重新刷新了所有任务的指标。在端到端火热起来之前,成熟的模块化自动驾驶系统被分解为不同的独立任务,例如感知、预测和规划,从而导致模块间信息丢失和错误累积。相比之下,端到端范式将多任务统一到一个完全可微分的框架中,从而允许以规划为导向进行优化。当然对于刚刚开始熟悉这一行的人来说,最简单也最值得接触的就是UniAD这各项目,这里最近受到优刻得的使用邀请,正好解决了我在大模型和自动驾驶行业对GPU的使用需求。

2024-07-25 18:10:33 1180

转载 论文阅读《MapTRv2: An End-to-End Framework for Online Vectorized HD Map Construction》

高精地图提供了丰富而精确的驾驶场景静态环境信息,是自动驾驶系统规划的基础和不可或缺的组成部分。在本文中,我们提出了Map TRansformer,一个用于在线矢量化高清地图构建的端到端框架。我们提出了一种统一的等效置换建模方法,即将地图元素建模为具有一组等效置换的点集,从而准确地描述了地图元素的形状并稳定了学习过程。我们设计了一种分层查询嵌入方案,对结构化地图信息进行灵活编码,并对地图元素进行分层二部匹配学习。为了加快收敛速度,我们进一步引入了辅助的一对多匹配和稠密监督。

2024-07-25 14:35:07 81

原创 经典文献阅读之--Segment Anything Model for Road Network Graph Extraction(基于遥感影像中提取向量化的道路网络)

虽然轻地图这套方案已经被业内广泛接受并使用,但是我们发现,对于地图的依赖仍然不可或缺,只是从HD(高精地图)降到了车道级地图(LD Map)乃至标准地图(SD Map)。所以说,我们如果高效的去获取向量化的道路还是非常关键的。》一文。这是对 Segment Anything Model (SAM) [29] 的一种改进,用于从卫星图像中提取大规模、矢量化的道路网络图。为了预测图形几何结构,我们将其形式化为一个密集语义分割任务,利用了 SAM 的固有优势。

2024-07-25 10:35:50 3266

原创 认识3D Gaussian Splatting以及如何和ROS结合完成实时建图

我们所知道的是高斯溅射需要预训练,然后才能完成比较好的建图,这里提出的要求就是如何预训练出比较好的参数,然后再将关键帧对应的位置作为输入,并完成3D环境的重建。这里是一个使用VINS作为输入的整体流程。高斯模型的初始化,初始化过程中加载或定义了各种相关的属性使用的球谐阶数、最大球谐阶数、各种张量(_xyz等)、优化器和其他参数。self.active_sh_degree = 0 #球谐阶数self.max_sh_degree = sh_degree #最大球谐阶数# 存储不同信息的张量(tensor)

2024-07-25 10:35:38 3622

原创 经典文献阅读之--How NeRFs and 3D Gaussian Splatting are Reshaping SLAM: a Survey (NeRFs和3D高斯溅射技术如何重塑SLAM:综述

在过去的二十年中,同时定位与地图构建(SLAM)领域的研究经历了显著的演变,凸显了其在实现未知环境自主探索方面的关键作用。这一演变涵盖了从手工方法,通过深度学习时代,再到最近聚焦于神经辐射场(NeRFs)和3D高斯点(3DGS)表示的最新发展。鉴于这一领域日益增长的研究和缺乏综合性的综述,本文旨在通过最新辐射场技术的发展视角,提供SLAM进展的首个全面概述。本文阐述了SLAM的背景、进化路径、固有优势和局限性,并作为一份基础性参考,突出了该领域的动态进展和具体挑战。图1:SLAM演变时间轴。

2024-07-25 10:35:15 3465

原创 经典文献阅读之--GraphAD(端到端自动驾驶的交互场景图)

对自车、道路参与者和地图元素之间复杂交互的建模一直是确保安全的自动驾驶的关键部分。之前关于端到端自动驾驶的研究依赖于注意力机制来处理异构交互,但这种方法未能捕捉几何先验,并且计算量巨大。在《》中,我们提出了交互场景图(ISG)作为一种统一的方法来建模自车、道路参与者和地图元素之间的交互。通过ISG的表示,驾驶代理可以从最具影响力的元素中聚合关键信息,包括潜在碰撞的道路参与者和需要遵循的地图元素。由于省略了大量不必要的交互,更高效的基于场景图的框架能够专注于不可或缺的连接,从而带来更好的性能。

2024-07-25 10:34:34 3399

原创 一文梳理自监督学习以及最火的端到端自动驾驶

特斯拉的FSD带火了自监督学习,而GPT这类大模型也使用了自监督学习的理念。众所周知,监督学习的成本过于高昂,尤其在任务复杂时,典型的就是FSD这样的系统。特斯拉收集的训练数据已经超出4亿公里,这些数据如果没有“自动标注系统”的帮助,根本无法用于训练。

2024-07-25 10:34:14 2901

原创 经典文献阅读之--Diffusion Model-Based Image Editing: A Survey(基于扩散模型的图像编辑)

去噪扩散模型已经成为各类图像生成和编辑任务的强大工具,这种方法无论是在无需先验输入条件下还是在基于输入的条件下,都能够高效地合成视觉内容。这一技术的核心理念在于,通过学习逆向操作——即逐步为图像添加噪声的过程,从而使其能够从复杂的分布中生成高质量的样本。在本次综述《》中,我们全面回顾了利用扩散模型进行图像编辑的现有技术,详细探讨了该领域内的理论与实践方面。我们从多个维度对这些方法进行了详尽的分析和分类,涉及学习策略、用户输入条件,以及能够实现的特定编辑任务等方面。

2024-07-25 10:33:58 3389

转载 基于BEVDET剖析MMDet3D框架

MMDet3D 官方文档MMDet3D官方仓库MMDet3D支持**_SUN RGB-D_**,_ScanNet__nuScenes_, **_Lyft_和_KITTI_**共5个主流数据集。对于上述数据集之外的公开数据集或者自定义数据集,可以通过继承 Custom3DDataset 来实现新的数据集类,并重载相关的方法,如 BEVDETNuScenesDataset数据集所示,该文件位于/mmdet3d/datasets/bevdet_nuscenes_dataset.py。

2024-07-24 13:17:33 45

原创 经典文献阅读之--LIV-GaussMap(实时3D辐射场地图渲染的LiDAR惯性视觉融合算法)

介绍了一种集成的精确激光雷达、惯性和视觉(LIV)多模态传感器融合映射系统,该系统基于可微表面散斑技术,提高了映射的保真度、质量和结构准确性。值得注意的是,这也是一种用于激光雷达-视觉-惯性传感器融合的紧密耦合映射的新形式。该系统利用激光雷达和视觉数据的互补特性,捕获大规模三维场景的几何结构,并以高保真度恢复其视觉表面信息。使用激光雷达-惯性系统并采用尺寸自适应体素获得表面高斯场景的初始姿态。然后,我们通过视觉导出的光度梯度对高斯进行优化和精细化,以优化激光雷达测量的质量和密度。

2024-07-24 11:41:13 3829

原创 经典文献阅读之--World Models for Autonomous Driving(自动驾驶的世界模型:综述)

在自动驾驶的快速发展领域中,准确预测未来事件及评估其含义的能力对于安全性和效率至关重要,这对决策过程至关重要。世界模型作为一种变革性方法出现,使自动驾驶系统能够合成和解释大量传感器数据,从而预测潜在的未来场景并弥补信息缺口。》提供了对自动驾驶中世界模型当前状态和未来进展的初步回顾,涵盖了它们的理论基础、实际应用以及旨在克服现有限制的持续研究努力。突出了世界模型在推进自动驾驶技术中的重要作用,本调查旨在为研究社区提供一个基础参考,便于迅速获取和理解这一新兴领域,并激发持续的创新和探索。

2024-07-24 11:40:47 3564

转载 经典文献阅读之--MapLocNet(实现自动驾驶新突破,告别GPS的亚米级定位)

上述实验结果表明,从俯视图的角度来看,节点、建筑物和车道的学习难度逐步降低,而它们在环境中的组成比例逐步增加,因此它们在定位中的重要性也逐步增加。BEV空间中的自车感知范围被定义为[−64m,64m,0.5mpp]的纵向轴和[−32m,32m,0.5mpp]的横向轴,深度分布的bins范围为[4m,60m,1mpp]。地图编码阶段,使用VGG-16主干来编码地图特征,与BEV模块类似,在地图解码器的不同阶段,也提取了粗细两层级地图特征,用于后续的层级特征配准。这些要素的空间排列为定位提供了重要的几何约束。

2024-07-15 16:44:09 2673

原创 Autoware 定位之localization工具(七)

这一讲按照《Autoware 技术代码解读(三)》梳理的顺序,我们来说一说Autoware中定位的工具以及error诊断,这一章还是比较简单的,里面的内容也比较清晰。

2024-07-15 15:59:20 4049

转载 激光雷达常见点云异常场景分析

Yole在2023年8月的报告中,统计了从2018年到2022年,在全球范围内激光雷达累计定点车型。其中,以国别区分的分布如下。中国占据了全球车用激光雷达市场的79%,是最大的车用激光雷达市场。图片来源:Yole以速腾、禾赛、华为、图达通等优秀的中国公司的激光雷达产品,占据了绝大部分市场份额。禾赛和速腾刚刚发布的今年Q1的销量如下:图片来源:禾赛、速腾本文描述的很多弱势场景问题,在我们很多公司的产品中都有非常好的应对方案。

2024-07-15 15:57:54 3198

转载 经典文献阅读之--DTCLMapper(双重时间一致性学习用于矢量化高清地图构建)

本文详细介绍了DTCLMapper框架,它由两个核心模块组成:实例一致性学习(ICL)和地图一致性学习(MCL)。ICL模块通过矢量点预选和聚合实例特征一致性学习,强化了实例特征在时间维度上的一致性。而MCL模块则通过全局的几何和状态一致性约束,确保了地图的整体一致性和泛化能力。这两个模块的协同作用显著提高了矢量化高精地图的构建精度和质量。作者计划进一步优化和扩展DTCLMapper框架,以适应更复杂的驾驶环境和处理更大规模的数据集。

2024-07-15 15:37:02 2742

原创 Autoware 定位之基于ARTag的landmark定位(六)

这一讲按照《Autoware 技术代码解读(三)》梳理的顺序,我们来说一说Autoware中基于地标的定位,这里的地标可以是:相机检测到的AR标签,还可以是通过LiDAR检测到的强度特征的板块。由于这些地标易于检测和估计姿态,如果地图上预先标注了地标的姿态,那么可以从检测到的地标的姿态计算出自我姿态。该代码实现了一个基于ArUco标记的定位器节点,其中包含了构造函数和设置节点参数、日志记录、tf变换、图像传输、订阅者和发布者等功能。设置函数setup()用于初始化节点参数、日志记录、tf变换、图像传输、订阅

2024-07-13 14:02:27 4564

原创 经典文献阅读之--DriveVLM(自动驾驶与大型视觉语言模型的融合)

本文介绍了DriveVLM:自动驾驶与大型视觉语言模型的融合。城市环境中自动驾驶的一个主要障碍是理解复杂且长尾的场景,例如具有挑战性的路况和微妙的人类行为。为此,本文引入了DriveVLM,这是一种利用视觉语言模型(VLMs)增强场景理解和规划能力的自动驾驶系统。DriveVLM集成了用于场景描述、场景分析和分层规划的思维链(CoT)模块的独特组合。

2024-07-13 14:01:41 4290

原创 经典文献阅读之--Self-Supervised Bird’s Eye View Motion,,(基于跨模态信号的自监督鸟瞰图运动预测)

本文介绍了基于跨模态信号的自监督鸟瞰图运动预测。以自监督的方式学习密集鸟瞰图(BEV)运动流是机器人和自动驾驶的一项新兴研究。目前的自监督方法主要依赖于点云之间的点对应关系,这可能会引入假的运动流和不一致的问题,阻碍了模型学习准确且现实的运动的能力。在本文中,我们引入一种新型的跨模态自监督训练框架,该框架通过利用多模态数据来获得监督信号,有效地解决了这些问题。》一文设计了三种创新的监督信号来保留场景运动的固有性质,包括masked倒角距离损失、分段刚性损失和时间一致性损失。相关代码可以在Github中找到。

2024-07-11 14:03:22 4413

原创 经典文献阅读之--DEviLOG(使用合成数据和真实世界数据的数据驱动占用网格映射基于Transformer的BEV方案量产方案)

在自动驾驶汽车(AV)的感知任务中,数据驱动的方法往往优于传统方法。这促使我们开发了一种基于数据的方法来从激光雷达测量中计算占用网格地图(OGM)。我们的方法扩展了之前的工作,使得估计的环境表示现在包含一个额外的层,用于标记被动态物体占据的单元格。早期的解决方案只能区分自由和占用的单元格。障碍物是否可以移动的信息对于规划AV的行为非常重要。》提出了两种生成训练数据的方法。一种方法扩展了我们以前关于使用合成训练数据的工作,以便生成具有上述三种单元状态的OGM。

2024-07-11 14:01:56 4125

转载 【SchurVINS】一种基于滤波的轻量视觉惯性导航系统

准确度和计算效率往往是用来评估视觉惯性导航系统的两大指标,目前现有的大部分VINS系统要么精度高,计算量却很大;要么计算量低,但是精度也很低。因此很难在资源受限的系统上提供准确的定位,为了解决这个问题,本文提出了SchurVINS,一种基于滤波的视觉惯性系统,综合考量了视觉残差,同时通过Schur操作降低计算复杂度,使得精度和效率的得到了良好的平衡,并在Euroc和TUM-VI数据集上做了充分的实验,和最先进的算法进行了比较,表现十分优异。

2024-07-09 17:52:24 3439

原创 经典文献阅读之--WidthFormer(基于Transformer的BEV方案量产方案)

提出了WidthFormer,这是一种基于Transformer的新颖鸟瞰视角(Bird’s-Eye-View, BEV)三维检测方法,专为实时自动驾驶应用而设计。WidthFormer在计算上高效、稳健,且无需特殊的工程努力即可部署。我们提出了一种新颖的三维位置编码机制,能够准确地封装三维几何信息,使得我们的模型仅通过一个Transformer解码层就能生成高质量的BEV表示。这种机制对现有的稀疏三维对象检测器也是有益的。受到最近提出的工作的启发,我们进一步通过垂直压缩图像特征。

2024-07-03 10:25:03 5331

原创 激光SLAM如何动态管理关键帧和地图

个人在想在长期执行的SLAM程序时,当场景发生替换时,激光SLAM如何有效的更新或者替换地图是非常关键的。在看了很多Life-Long的文章后,个人觉得可以按照以下思路去做。这里可以给大家分享一下。

2024-07-03 10:17:31 5529

原创 经典文献阅读之--iDet3D(交互式3D目标检测器)

在激光雷达场景中准确标注多个3D物体是费时且具有挑战性的工作。虽然之前有一些研究尝试利用半自动方法进行成本效益高的包围盒标注,但这些方法在有效处理大量多类别物体时存在局限。为了有效加速3D标注流程,《》提出了iDet3D,一个高效的交互式3D物体检测器。iDet3D支持用户友好的2D界面,该界面可以减轻用户在3D空间中进行点击交互的认知负担,使用户能够通过最少的交互完成每个场景中全部物体的标注。考虑到3D点云的稀疏性,我们设计了一种负点击模拟(NCS)机制来提高准确性,通过减少误报预测。

2024-07-01 18:45:20 5474

原创 经典文献阅读之--MobileViT(轻量级、通用且移动友好的网络框架)

轻量级卷积神经网络(CNNs)已成为移动视觉任务的标准选择。它们的空间归纳偏置使得它们能在各种视觉任务中通过较少的参数学习表示。然而,这些网络在空间上具有局部性。为了学习全局性表示,人们开始采用基于自注意力机制的视觉Transformer(ViTs)。不同于CNNs,ViTs模型较大。在《》文中,我们探讨了这样一个问题:是否可以结合CNNs和ViTs的优点,为移动视觉任务构建一个轻量级且延迟低的网络?为此,我们介绍了MobileViT,一种适用于移动设备的轻量级和通用视觉Transformer。

2024-06-26 16:54:13 6589

原创 Autoware 定位之GEO坐标转换与带有IMU的里程计(五)

我们在上一篇中给我们的定位开了一个头,下面我们继续按照按照《Autoware 技术代码解读(三)》梳理的顺序,我们一个个慢慢来看与学习。这一讲我们来看GEO坐标转换与带有IMU的里程计。

2024-06-25 17:09:16 6176

MIXVPR训练权重文件

MIXVPR训练权重文件

2024-08-19

各学科重要国际学术会议目录.pdf

各学科重要国际学术会议目录,可以知道自己所投会议影响力

2022-01-07

ROS 导航功能调优指南∗.pdf

ROS 导航功能包用于实现移动机器人可靠移动。ROS 导航功能包通过处理里程数据、传 感器数据和环境地图数据,为机器人运动生成一条安全的路径。最大限度地优化导航功能包 的性能需要对相关参数进行调整,且调参这项工作并不像表面上的那么简单。对其中的概念和推理不熟悉的人很大概率会采用随机尝试的策略,无形中浪费了大量时间。

2022-01-07

ROS2相关资源.pdf

一本ROS2相关的资料整合,非常适合初学者学习

2022-01-07

ROS_One.zip

ROS QT交互软件,打开即用

2021-04-13

占据栅格地图构建分享.zip

Gmapping的地图构建部分

2021-04-12

kuka代码.zip

基于ros的KUKA iiwa700机器人控制操作,已提供说明文档,有问题可以咨询

2021-02-26

机械臂项目kuka_iiwa.zip

本资源主要是KUKA_iiwa强化学习仿真,利用强化学习实现机械臂的抓取,并附有详细的代码注释。

2020-04-30

小觅摄像头Opencv处理

小觅摄像头Opencv处理,https://blog.csdn.net/lovely_yoshino/article/details/94859666实现过程

2019-07-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除