![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
论文笔记
文章平均质量分 90
个人论文阅读笔记
小白_日志
这个作者很懒,什么都没留下…
展开
-
用于自动驾驶的基于立体视觉的语义 3D 对象和自我运动跟踪
我们提出了一种基于立体视觉的方法,用于在动态自动驾驶场景中跟踪相机自我运动和 3D 语义对象。我们建议使用。原创 2024-07-25 11:17:46 · 944 阅读 · 0 评论 -
VSO视觉语义里程计
鲁棒的数据关联是视觉里程计的核心问题,其中图像到图像的对应关系为相机姿态和地图估计提供了约束。当前最先进的直接和间接方法使用短期跟踪来获得连续的帧到帧约束,而长期约束则使用闭环建立。在本文中,我们提出了一种新颖的视觉语义里程计(VSO)框架,以使用语义对点进行中期连续跟踪。我们提出的框架可以轻松集成到现有的直接和间接视觉里程计管道中。对具有挑战性的现实世界数据集的实验表明,通过集成我们的语义约束,在自动驾驶的背景下,与最先进的基线相比有了显着的改进。原创 2024-07-24 16:53:52 · 588 阅读 · 0 评论 -
全景分割动态视觉slam
大多数视觉 SLAM 系统在动态场景中并不稳健。处理场景中的动态对象的方法通常依赖于基于深度学习的方法来检测和过滤这些对象。然而,这些方法无法处理未知的移动物体。这项工作提出了 Panoptic-SLAM,这是一种对动态环境具有鲁棒性的开源视觉 SLAM 系统,即使存在未知物体也是如此。它在状态估计过程中使用全景分割来过滤场景中的动态对象。PanopticSLAM 基于 ORB-SLAM3,这是一种适用于静态环境的最先进的 SLAM 系统。原创 2024-07-19 11:08:54 · 791 阅读 · 0 评论 -
DDRNet实时语义分割
语义分割是自动驾驶汽车理解周围场景的关键技术。当代模型的吸引人的性能通常是以繁重的计算和漫长的推理时间为代价的,这对于自动驾驶来说是无法忍受的。最近的方法使用轻量级架构(编码器-解码器或双路径)或对低分辨率图像进行推理,实现了非常快速的场景解析,甚至在单个 1080Ti GPU 上以超过 100 FPS 的速度运行。然而,这些实时方法与基于扩张主干的模型在性能上仍然存在显着差距。为了解决这个问题,本文提出了一系列专门为实时语义分割而设计的高效主干网。所提出的。原创 2024-07-15 15:19:56 · 599 阅读 · 0 评论 -
3DS-SLAM(3D目标检测,动态视觉slam)
环境中可变因素的存在可能会导致相机定位精度下降,因为它违反了同步定位与建图(SLAM)算法中静态环境的基本假设。最近针对动态环境的语义 SLAM 系统要么仅依赖于 2D 语义信息,要么仅依赖于几何信息,或者以松散集成的方式组合它们的结果。在这篇研究论文中,介绍了 3DS-SLAM(3D 语义 SLAM),原创 2024-07-11 17:21:44 · 833 阅读 · 0 评论 -
DynaTM-SLAM:针对动态环境设计的鲁棒语义视觉SLAM算法
由于科学技术的进步,已经开发出许多先进的同步定位与建图(SLAM)算法。然而,它们在复杂的现实场景中的实际适用性受到对象静止的假设的严重限制。因此,提高 SLAM 算法在动态环境中的准确性和鲁棒性至关重要。使用语义分割或对象检测对动态环境中的 SLAM 进行了大量研究,但这些方法的一个主要缺点是,原创 2024-07-10 11:10:13 · 1181 阅读 · 0 评论 -
PVO全景视觉里程计
本文提出了 PVO,一种新颖的全景视觉里程计框架,用于实现场景运动、几何和全景分割信息的更全面的建模。该文中的 PVO 在统一视图中对视觉里程计 (VO) 和视频全景分割 (VPS) 进行建模,这使得这两项任务互惠互利。具体来说,本研究在图像全景分割的指导下将全景更新模块引入到VO模块中。该 全景增强 VO 模块可以通过全景感知动态掩模减轻动态物体对相机姿态估计的影响。原创 2024-07-09 11:16:54 · 867 阅读 · 0 评论 -
RTAB-map:实时高效的SLAM库
Real‐time appearance‐based mapping (RTAB‐Map)是一种基于外观的闭环检测方法,具有良好的内存管理,以满足处理大场景和在线长周期管理要求。RTAB‐Map集成了视觉和激光雷达SLAM方案,并支持目前绝大多数的传感器是一个强大的、开源的Simultaneous Localization and Mapping(SLAM)库,专为机器人和无人驾驶领域设计。它提供了一套完整的解决方案,用于构建三维地图,并在未知环境中进行实时定位与导航。github项目地址RTAB-原创 2024-07-05 11:24:25 · 1102 阅读 · 0 评论 -
CFP-SLAM动态视觉slam
环境中的动态因素会违反SLAM算法的静态环境假设,导致相机定位精度下降。最近,一些相关工作普遍采用语义约束和几何约束相结合的方式来处理动态物体,但是仍然会出现一些问题,比如实时性差,容易把人当成刚体,低动态性能差场景。本文提出了一种基于目标检测和由粗到精静态概率的动态场景视觉SLAM算法CFP-SLAM。该算法结合语义约束和几何约束,计算物体、关键点和地图点的静态概率,并将其作为权重参与相机位姿估计。原创 2024-07-04 23:04:34 · 1006 阅读 · 0 评论 -
实时全局分割YOSO
在这篇论文中,提出了YOSO,一个实时的全景分割框架。YOSO通过全景内核与图像特征图之间的动态卷积来预测掩码,只需要一次分割就可以同时完成实例分割和语义分割任务。为了降低计算开销,设计了一个特征金字塔聚合器来提取特征图,以及一个用于全景核生成的可分离动态解码器。聚合器以卷积为主的方式重新参数化了插值优先模块,这显著加速了管道的速度,而没有额外的成本。解码器通过可分离动态卷积执行多头交叉注意力,以提高效率和准确性。YOSO是第一个实时全景分割框架,与最先进的模型相比,它能够提供竞争性的性能。原创 2024-06-26 17:28:31 · 1095 阅读 · 0 评论 -
Removet--SLAM动态障碍物滤除
本文提出了一种新颖的静态点云地图构建算法,称为Removet,用于动态城市环境。仅留下静态点并排除动态对象是户外变化的各种鲁棒机器人任务中的关键问题,并且该过程通常包括将查询与具有动态点的噪声地图进行比较。然而,这样做时,查询扫描和噪声地图之间的估计差异往往会由于不完善的姿态估计而产生错误,这会降低静态地图质量。为了解决这个问题,本文提出了一种基于多分辨率范围图像的错误预测恢复算法。原创 2024-06-20 15:09:54 · 1437 阅读 · 0 评论 -
DynamicFilter
文提出了一种在线动态对象去除框架,该框架集成了基于地图和基于可见性的方法。各种实验验证了其在高度动态场景中的效率。原创 2024-06-19 14:53:52 · 865 阅读 · 0 评论 -
CVPR2024:XFeat
我们介绍了一种轻量级而准确的资源高效视觉对应的架构。我们的方法,被称为XFeat(加速特征),重新审视了卷积神经网络在检测、提取和匹配局部特征方面的基本设计选择。我们的新模型满足了对于适用于资源有限设备的快速和稳健算法的迫切需求。特别是,准确的图像匹配需要足够大的图像分辨率------出于这个原因,我们尽可能地保持分辨率的大小,同时限制网络中通道的数量。此外,我们的模型被设计为在稀疏或半密集级别进行匹配的选择,其中每种级别可能更适合不同的下游应用,比如视觉导航和增强现实。原创 2024-06-18 17:18:40 · 669 阅读 · 0 评论 -
DeViLoc视觉定位
这项研究解决了在夜间场景、恶劣天气和季节变化等苛刻条件下执行视觉定位的挑战。虽然许多先前的研究都集中在提高图像匹配性能以促进图像之间可靠的密集关键点匹配,但现有方法通常严重依赖于重建 3D 模型上的预定义特征点。因此,他们往往会在匹配过程中。原创 2024-06-04 20:41:51 · 463 阅读 · 0 评论 -
DDN-SLAM
论文链接:https://arxiv.org/abs/2401.015451、动态环境下的NeRF SLAM方法。2、利用先验的语义信息来分割场景中的静态和动态特征点,构建了用于潜在动态点和约束关键帧的稀疏流约束。3、(重建)提出了基于跳跃体素策略的背景填充策略,相较于传统方法更具成本效益。4、利用语义掩码联合多分辨率哈希编码来实现实时性能、低内存消耗和高质量几何和纹理细节之间的平衡。5、通过合理的像素填充消除了动态物体的干扰,并限制了鬼影伪像的生成。原创 2024-06-03 09:20:33 · 441 阅读 · 0 评论 -
orbsalm2论文笔记
但是,这带来了将BA输出与地图的当前状态合并的挑战。完整BA完成后,我们需要将更新后的关键帧和关键点子集(完整BA后的)与未更新的关键帧和点合并在一起,这些关键点和点将在优化运行时插入,通过生成树将更新的关键帧的校正传播到未更新的关键帧(即从未优化的姿势转换为优化的姿势), 未更新的点根据参考关键帧的校正进行变换。系统维护一个图(节点和连线),该图链接具有共同点的两个关键帧和连接所有关键帧的最小生成树(生成树是将原图的全部顶点以最少的边连通的子图,权值总和最小的生成树则称为图的最小生成树)。原创 2023-08-24 10:22:11 · 77 阅读 · 1 评论 -
协方差矩阵
1、协方差矩阵在统计学和机器学习中随处可见,一般而言,可视作方差和协方差两部分组成,即方差构成了对角线上的元素,协方差构成了非对角线上的元素。就是方差及协方差在一个矩阵中表现出来。这里就体现了变量间的相关性。原创 2023-08-22 17:39:06 · 171 阅读 · 1 评论 -
Large-Scale, Real-Time 3D Scene Reconstruction Using Visual and IMU Sensors
这里也省略了闭环检测的平均时间。然而,在相机进给抖动、特征较少以及场景中存在运动物体的情况下,使用视觉传感器的传统三维重建系统容易导致三维模型的错位和漂移。现有的基于视觉惯性里程计( VIO )的三维重建系统使用复杂的算法,导致内存消耗大,限制了在移动设备上的适用性。与上述两个系统相比,可以看出,本系统中基于MSKF的VIO的位姿精确计算可以更好地应对白墙和玻璃等特征稀疏的情况。此外,我们提出的三维重建系统在状态向量中保持了一段时间的图像信息和延迟线性化,既保证了算法的准确性,又更有效地利用了资源。原创 2023-08-21 20:59:35 · 59 阅读 · 1 评论