自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(67)
  • 收藏
  • 关注

原创 检查cuda和pytorch版本是否匹配

在虚拟环境中安装了 PyTorch 后,你可以在该环境中进行各种深度学习任务和开发工作。虚拟环境的好处在于可以隔离不同项目的依赖关系,确保它们之间不会相互影响。在虚拟环境中安装了 PyTorch 后,你可以做以下事情:1. 深度学习模型开发:使用 PyTorch 构建、训练和评估深度学习模型。PyTorch 提供了灵活而强大的工具,使得深度学习任务变得更加容易。2. 实验和研究:在虚拟环境中,你可以轻松地尝试新的深度学习模型、算法和技术,进行实验和研究。

2024-04-15 19:51:00 1068

原创 点云预处理——滤波、旋转和平移等处理

点云预处理——滤波、旋转和平移等处理。网上找了各种办法没有解决,我直接重新开始安装一遍。还可以运行自己的数据,修改lanch文件就行。安装好ubuntu系统和ROS环境。

2024-03-19 15:56:54 382

原创 ubuntu20.04:bin文件转化为pcd文件

环境:ubuntu20.04KITTI数据集由德国卡尔斯鲁厄理工学院和丰田美国技术研究院联合创办,是目前国际上最大的自动驾驶场景下的计算机视觉算法评测数据集。该数据集用于评测立体图像(stereo),光流(optical flow),视觉测距(visual odometry),3D物体检测(object detection)和3D跟踪(tracking)等计算机视觉技术在车载环境下的性能。

2024-03-19 14:37:37 641

原创 opencalib的标定代码学习

opencailb的源代码。

2024-03-14 16:53:06 583

原创 现代信号处理学习笔记(五)自适应滤波器

滤波器可以实现滤波、平滑和预测等信息处理的基本任务。如果滤波器输出是滤波器输入的线性函数,则称为线性滤波器;否则称为非线性滤波器。若滤波器的冲激响应是无穷长的,便称为无限冲激响应(IIR)滤波器,而冲激响应有限长的滤波器叫做有限冲激响应(FIR)滤波器。如果滤波器是在时间域、频率域或空间域实现,则分别称为时域滤波器、频域滤波器或空域滤波器。“信号与系统”和“数字信号处理”等课程主要是在频率域讨论滤波器,本章重点关注时域滤波器。自适应滤波器是一种信号处理技术,用于从信号中提取所需信息或去除噪声。

2024-03-14 15:39:40 1026

原创 视觉slam十四讲学习笔记(七)视觉里程计 2

1.理解光流法跟踪特征点的原理。2.理解直接法是如何估计相机位姿的。3.使用g2o进行直接法的计算。视觉SLAM十四讲ch7_2_哔哩哔哩_bilibili一、直接法的引出视觉slam十四讲学习笔记(六)视觉里程计 1-CSDN博客介绍了使用特征点估计相机运动的方法。尽管特征点法在视觉里程计中占据主流地位,但有以下几个缺点:关键点的提取与描述子的计算非常耗时。实践当中,SIFT目前在CPU 上是无法实时计算的,而ORB也需要近20毫秒的计算。如果整个SLAM以30。

2024-03-05 14:05:47 898

原创 现代信号处理学习笔记(四)现代谱估计

傅里叶变换是将信号从时域转换到频域的基本工具。它可以用来计算信号的频谱。周期图法是通过计算信号的周期图(也称为功率谱密度)来估计信号的频谱。这是通过将信号分成小段,并计算每个段的傅里叶变换的平方来实现的。自相关函数和互相关函数提供了信号在时间域上的相关性信息。它们可以用于估计信号的频谱特性。在频谱中寻找峰值并进行拟合是一种常见的谱估计方法。这通常用于精确估计信号的频率成分。采用各种滤波技术,如周期性平均、平滑滤波等,来估计信号的频谱特性。高阶谱估计方法包括二阶谱、三阶谱等。

2024-03-05 09:17:38 1294

原创 现代信号处理学习笔记(三)信号检测

通过将信号检测视为统计假设检验问题,就可以采用一种通用的数学框架讨论和分析不同情况下的信号检测。本章正是从这一视角出发,对信号检测的有关理论、方法与应用展开讨论。通过观测数据判断信号是否存在,这一问题称为信号检测,它本质上是一种统计假设检验。所谓统计假设,就是关于我们感兴趣的一个总体的某个未知特征的主张。检验一个统计假设的根本任务即是:决定关于某个未知特征的主张是否为随机试验的观测样本所支持。通常,这一主张涉及的是采样的随机分布的某个未知参数或者某个未知函数。

2024-03-04 17:34:04 1132

原创 论文阅读:SOLOv2: Dynamic, Faster and Stronger

SOLO v2遵循了SOLO的优雅、简单的设计,并且针对mask的检测效果和运行效率做了两个改进:(1)mask learning:能够更好地学习到mask(2)mask NMS:提出了matrix nms,大大减少了前向推理的时间。重点看一下Mask Branch,每个正样本(有类别输出的网格)都会输出对应类别的instance mask,这里的通道channel和网格的对应关系是:第k个通道负责预测出第(i,j)个网格的instance mask,k = i*S+j。这就对应了网络的两个分支。

2024-02-27 19:59:26 1118

原创 win11配置mmdetection--SOLOV2实例

MMDetection是商汤和港中文大学针对目标检测任务推出的一个开源项目,它基于Pytorch实现了大量的目标检测算法,把数据集构建、模型搭建、训练策略等过程都封装成了一个个模块,通过模块调用的方式,我们能够以很少的代码量实现一个新算法,大大提高了代码复用率。整个MMLab家族除了MMDetection,还包含针对目标跟踪任务的MMTracking,针对3D目标检测任务的MMDetection3D等开源项目,他们都是以Pytorch和MMCV以基础。

2024-02-27 16:56:02 954

原创 配置MMDetection的solov2攻略整理

MMDetection是一个用于目标检测的开源框架,由OpenMMLab开发和维护。它提供了丰富的预训练模型和模块,可以用于各种目标检测任务,如物体检测、实例分割、关键点检测等。

2024-02-27 10:55:04 1004

原创 现代信号处理学习笔记(二)参数估计理论

参数估计理论是统计学中的一个重要概念,它涉及到从样本数据中推断总体参数的方法和原理。在统计学中,我们通常面对的是从总体中抽取的有限样本,而参数估计的目标就是利用这些样本数据来估计总体的未知参数。点估计是指通过样本数据得到一个特定的数值,用来估计总体参数。这个估计值通常用符号(例如,)表示。估计量是指用于估计总体参数的统计量,它是一个随机变量。样本均值和样本方差是常见的估计量。一个估计量是无偏的,如果它的期望值等于被估计的参数真值。在无偏估计中,效率指的是方差的大小。

2024-02-26 16:44:25 1001

原创 现代信号处理学习笔记(一)随机信号

信号是信息的载体。信号的信息可以是一系统的模型参数、冲激响应和功率谱,也可以是一人工目标(的分类特征,还可以是诸如气象、水文的预报、人体心电的异常等等。其数值或观测值为随机变量的信号称为随机信号。随机,是指信号的取值服从某种概率分布规律。这一规律可以是完全已知的、部分已知的或完全未知的。随机信号也称随机过程、随机函数或随机序列。以上就是今天的所有内容。仅简单介绍了部分随机信号的分类。

2024-02-21 10:29:26 1276

原创 论文阅读:MotionNet基于鸟瞰图的自动驾驶联合感知和运动预测

MotionNet:基于鸟瞰图的自动驾驶联合感知和运动预测。本文主要介绍了一种名为MotionNet的模型,通过将LiDAR扫描转换成鸟瞰图,实现了对自动驾驶中物体的感知和运动预测。该模型采用了一种新颖的空间时间金字塔网络,可逐层提取深度的空间和时间特征。为了保证预测的平滑性,该模型还采用了新颖的空间和时间一致性损失。实验表明,MotionNet的性能优于目前最先进的方法,可以为自动驾驶提供补充信息。

2024-02-17 11:09:31 1606 4

原创 《随机过程及应用》

《随机过程及应用》笔记整理

2024-02-17 10:58:36 381

原创 视觉slam十四讲学习笔记(六)视觉里程计 1

1.理解图像特征点的意义, 并掌握在单幅图像中提取出特征点,及多幅图像中匹配特征点的方法。2. 理解对极几何的原理,利用对极几何的约束,恢复出图像之间的摄像机的三维运动。3.理解PNP 问题,及利用已知三维结构与图像的对应关系,求解摄像机的三维运动。4.理解ICP问题,及利用点云的匹配关系,求解摄像机的三维运动。5.理解如何通过三角化,获得二维图像上对应点的三维结构。视觉SLAM十四讲ch7_1_哔哩哔哩_bilibili。

2024-02-16 10:42:24 1172

原创 论文阅读:LiDAR-based curb detection for ground truth annotation in automated driving validation

路沿检测在自动驾驶中是环境感知的关键,因为它通常界定了可驾驶区域和不可驾驶区域。标注的数据对于开发和验证自动驾驶功能是必不可少的。然而,带有标注的点云路沿的公共数据集数量很有限。本文提出了一种从激光雷达传感器捕获的一系列点云中检测3D路沿的方法,主要包括两个步骤。首先,方法使用分割深度神经网络在每个扫描中检测路沿。然后一个序列级处理步骤利用车辆的里程数据在重建的点云中估计3D路沿。从这些路沿的3D点云中,按照ASAM OpenLABEL标准获取结构化的折线。

2024-02-16 08:00:00 1020 1

原创 随机过程及应用学习笔记(四) 马尔可夫过程

经典力学中,在一给定时刻t的轨道,完全可以用在某时刻t0≥t0)所处的状态与过程在t-t0时刻之前的状态无关。这种已知“现在”的条件下,“将来”与“过去”无关的性质,就是直观意义下的马尔可夫性或称为无后效性。具有无后效性的过程称为马尔可夫过程。

2024-02-15 14:23:09 1293

原创 视觉slam十四讲学习笔记(五)非线性优化

1.理解最小二乘法的含义和处理方式。2.理解等下降策略。3.学习Ceres库和g2o库的基本使用方法。视觉SLAM十四讲ch6_哔哩哔哩_bilibili在视觉SLAM(Simultaneous Localization and Mapping,即同时定位与地图构建)中,最大后验估计(Maximum A Posteriori Estimation,MAP)和最大似然估计(Maximum Likelihood Estimation,MLE)是两种常用的参数估计方法。

2024-02-15 13:07:45 1462

原创 随机过程及应用学习笔记(三)几种重要的随机过程

独立过程和独立增量过程在概率论和随机过程理论中有着重要的意义,它们提供了对随机现象和随机变量演变的一种数学描述,并在多个领域中有广泛的应用。正态过程,也被称为高斯过程(Gaussian Process),是一类随机过程,其中任何有限个随机变量的线性组合仍然是正态分布的。换句话说,对于任意有限个时间点 {t₁, t₂, ..., tₙ},随机变量组 X(t1​),X(t2​),...,X(tn​) 的线性组合(即 ∑i=1n​ai​X(ti​),其中 ai​ 是常数)的分布都是正态分布。

2024-02-14 22:19:48 1233

原创 视觉slam十四讲学习笔记(四)相机与图像

前面介绍了“机器人如何表示自身位姿”的问题,部分地解释了 SLAM 经典模型中变量的含义和运动方程部分。本文要讨论“机器人如何观测外部世界”,也就是观测方程部分。而在以相机为主的视觉SLAM中,观测主要是指相机成像的过程。视觉SLAM十四讲ch5_哔哩哔哩_bilibili一、相机模型相机将三维世界中的坐标点(单位为米)映射到二维图像平面(单位为像素)的过程能够用一个几何模型进行描述。这个模型有很多种,其中最简单的称为针孔模型。

2024-02-14 21:33:53 1346

原创 Ubuntu+Anaconda 常用指令记录

注意:在使用conda命令时,确保你已经安装了Anaconda或Miniconda,并已将conda添加到系统的环境变量中。包括源代码、文本等等,通过后缀来决定。例如,.cpp/.cc是c++源代码,而.py是python源代码。用于输入需要前往的路径/目录。,然后输入密码即可;

2024-02-13 21:46:23 901

原创 随机过程及应用学习笔记(二)随机过程的基本概念

随机过程理论产生于本世纪初,起源于统计物理学领域。布朗运动和热噪声是随机过程的最早例子。随机过程理论在社会科学、自然科学和工程技术的各个领域中都有着广泛的应用。例如:现代电子技术、现代通讯、自动控制、系统工程的可靠性工程、市场经济的预测和控制、随机服务系统的排队论﹑储存论、生物医学工程、人口的预测和控制等等。只要人们要研究随时间变化的动态系统的随机现象的统计规律时,就要应用到随机过程的理论。随机过程可以形式化地定义为一个随机变量的集合 {X(t), t ∈ T},其中 T 是一个表示时间的参数集合。

2024-02-13 10:11:33 1432

原创 视觉slam十四讲学习笔记(三)李群与李代数

三维世界中刚体运动的描述:旋转矩阵、旋转向量、欧拉角、四元数等。除了表示之外,还要对它们进行估计和优化。旋转矩阵自身带有约束(正交且行列式为1)。作为优化变量时,会引入额外的约束,使优化变得困难。李代数上可以变成无约束优化。视觉SLAM十四讲ch4_哔哩哔哩_bilibili以上就是今天要讲的内容,本文重点介绍了旋转的表示,但是在SLAM 中,除了表示之 外,我们还要对它们进行估计和优化。因为在SLAM中位姿是未知的,而我们需要解决什么样的相机位姿最符合当前观测数据这样的问题。

2024-02-12 20:11:36 967

原创 随机过程及应用学习笔记(一)概率论(概要)

首先,概率论研究的基础是概率空间。概率空间由一个样本空间和一个概率测度组成,样本空间包含了所有可能的结果, 而概率测度则描述了每个结果发生的可能性大小。研究者通过定义适当的概率测度,可以更准确地描述各种随机现象的发生概率。一般而言,对于随机变量X的分布,大家习惯用概率密度函数来描述,虽然概率密度函数理解起来很直观,但是确实随机变量的分布还有另外的描述方式,比如特征函数。特征函数的本质是概率密度函数的泰勒展开每一个级数表示原始概率密度函数的一个特征。

2024-02-12 09:07:30 2061 1

原创 视觉SLAM十四讲学习笔记(二)三维空间刚体

以上就是今天要讲的内容,本文仅仅简单介绍了Eigen 来表示矩阵、向量, 随后引申至旋转矩阵与变换矩阵的计算。Eigen①是一个C++ 开源线性代数库。它提供了快速的有关矩阵的线性代数运算,还包括解方程等功能。许多上层的软件库也使用Eigen进行矩阵运算,包括g2oSophus等。

2024-02-11 13:20:51 992

原创 视觉SLAM十四讲学习笔记(一)初识SLAM

SLAM: Simultaneous Localization and Mapping 同时定位与地图构建(建图)。搭载特定传感器的主体,在没有环境先验信息的情况下,于运动过程中建立环地的模型。同时储计自己的运动。视觉SLAM:以相机为主要传感器的SLAM。同时从图像中估计相机的运动以及环境的情况。传感器在空间运动中将自己的运动估计出来,返给使用者;在运动过程中描述出运动环境。【高翔】视觉SLAM十四讲_哔哩哔哩_bilibili。

2024-02-04 15:06:14 1173

原创 论文阅读:Lidar Annotation Is All You Need

论文重点在探讨利用点云的地面分割任务作为标注,直接训练Camera的精细2D分割。在以往的地面分割任务中,利用Lidar来做地面分割是目前采用激光雷达方案进行自动驾驶的常见手段。来自Evocargo LCC的学者认为在2D上直接做分割的标注(尤其是高精度的分割标注)是比较耗时耗力的,这会带来很多额外的成本,不利于大规模自动驾驶量产。作者提出使用3D的地面粗分割结果(例如patchwork++这种无需训练的模型)作为reference。解决了激光雷达点云的稀疏地面实况蒙版的问题。

2023-12-11 16:08:20 307

原创 opencalib中lidar2camera安装记录

我没有把openclib整个安装下来,只装了我需要的lidar2camera,以下是安装过程。因为我开始安装的时候创建了一个calib的虚拟环境,所以无法正常运行,切换环境后即可。依次输入命令,进入刚刚下载好的源文件目录,并进行安装。通过which cmake可以查看安装的路径。

2023-10-25 19:07:46 1218 10

原创 论文阅读:Offboard 3D Object Detection from Point Cloud Sequences

该方法利用点云序列中不同帧所捕获的物体的互补视角信息,通过多帧物体检测和新颖的物体中心优化模型来利用时间点云。然后,提出了新的深度网络模型来处理这样的4D目标跟踪数据,并输出时间已知且高质量的目标box。关键是使用点云序列数据来进行物体检测,并设计了一个新的离线物体检测管道,利用多帧物体检测和新的物体中心检测模型来提高检测准确性。为每个对象提取对象跟踪数据(其每帧的点云及其 3D 边界框),然后通过以对象为中心的自动标记(静态和动态轨迹的分而治之)生成最终的“自动标签”,即细化的 3D 边界框。

2023-10-15 16:37:51 1659

原创 论文阅读:CTRL: Surpassing Human Performance in Offline LiDAR based 3D Object Detection

这篇论文提出了一种新的离线3D目标检测系统,该系统采用了一种跟踪中心的设计,并具有一个基于跟踪的检测模块和一个跟踪中心的学习模块。此外,该方法还提出了一种新的跟踪中心的标注方法,能够有效地解决目标检测中的标注歧义问题。命名为名称,即使检测到的物体在某些时间步骤中没有足够的点云数据,也可以利用该物体的时间序列信息来推断其位置和姿态,从而提高目标检测的准确性。大量的实验表明,该方法在竞争激烈的Waymo开放数据集中,在没有模型集成的情况下,超过了人类水平的注释精度和之前最先进的方法。CTRL的整体架构。

2023-10-15 15:56:53 355

原创 论文阅读:CenterFormer: Center-based Transformer for 3D Object Detection

设计了一种通过交叉注意融合特征的方法,能进一步聚合多帧的特征。该网络由四个部分组成:将原始点云编码为 BEV 特征表示的体素特征编码器、多尺度中心提议网络 (CPN)、基于中心的Transformer解码器和用于预测边界框的回归头。为了进一步探索变压器的能力,还提出了一种多帧设计,通过交叉注意融合来自不同帧的特征。由于具有多尺度特征,因此能够在提议的中心周围捕获广泛的特征。限制在每个尺度的中心位置附近的一个 3×3 小窗口,如上图 所示。其中p表示中心建议,这里的Ωj是中心周围的窗口,s是尺度的索引。

2023-10-15 14:44:28 1588 2

原创 论文阅读:Segment Any Point Cloud Sequences by Distilling Vision Foundation Models

视觉基础模型 (VFMs) 的最新进展为通用且高效的视觉感知开辟了新的可能性。在这项工作中,论文中介绍了 一个新颖的框架Seal,利用 VFM 来分割不同的汽车点云序列。在11个不同的点云数据集上进行的大量实验证明了Seal的有效性和优越性。Seal在线性探测后在nuScenes上实现了显著的45.0% mIoU,超过了随机初始化36.9% mIoU,比现有技术高出6.1% mIoU。此外,Seal 在所有 11 个测试点云数据集上的 20 个不同的小样本微调任务中显示出比现有方法显着的性能提升。

2023-10-15 13:34:28 769

原创 论文阅读:Image-to-Lidar Self-Supervised Distillation for Autonomous Driving Data

自动驾驶汽车的图像到雷达自我监督蒸馏。在自动驾驶中两项重要任务:分割或检测稀疏激光雷达点云目标(使车辆在3D环境中安全运行)。在3D语义分割或目标检测中,性能最好的方法依赖于大量带标注数据(注释3D激光雷达数据既复杂又昂贵)。论文提出一种自监督预训练方法,适用于自动驾驶数据的3D感知模型。即,利用自动驾驶设备中同步和校准的图像和激光雷达传感器的可用性,将自监督的预训练图像表征蒸馏到3D模型中(不需要任何点云或图像标注)。方法关键是使用超像素(superpixel)

2023-10-14 20:22:58 831

原创 ubuntu20.04系统安装使用labelme标注数据集

2、点击【open】,选择图片;【Edit Polygons】----> 【Create Polygons】2.激活虚拟环境,开始安装。输入“y”,然后回车。1.打开终端创建虚拟环境。3、可以选择自动保存。

2023-07-19 15:58:57 1682

翻译 学习笔记:Center-based 3D Object Detection and Tracking

本篇CenterPoint是基本沿用了CenterNet的方法,基本上是在CenterNet网络上做一些扩展工作。主干网络选用的是Pointpillars和VoxelNet的方法。本文仅仅简单翻译了CenterPoint这篇论文,而CenterPoint的实际使用还有待探索。

2023-05-30 15:03:35 373

原创 C++ primer 初学(八)数组与指针

数组是一种类似于标准库类型vector的数据结构,但是在性能和灵活性的权衡上又与vector有所不同。与vector相似的地方是,数组也是存放类型相同的对象的容器,这些对象本身没有名字,需要通过其所在位置访问。与vector不同的地方是,数组的大小确定不变,不能随意向数组中增加元素。因为数组的大小固定,因此对某些特殊的应用来说程序的运行时性能较好,但是相应地也损失了一些灵活性。数组是一种复合类型。数组的声明,形如 a [d],其中 a是数组的名字,d是数组的维度。维度说明了数组中元素的个数,因此必须大于0。

2023-04-24 19:46:54 64

原创 【点云语义分割】Ubuntu20.04配置运行RangeNet++

如果Cuda下载用的是deb(local),则TensorRT也需要下载Debian包本地安装;而Cuda用runfile安装,就得下载tar压缩安装;两者需要对应,否则安装会报错。将解压出的文件,移动到/usr/local/cuda文件夹下:(根据自己的路径进行修改)选择Archived cuDNN Releases。开始安装,取消安装驱动,其余默认(y)安装。赋予所有用户权限,cudnn安装完成。需要花点时间,请耐心等待。下载完成后,解压到本地。python接口验证。

2023-04-24 14:40:18 926 8

原创 (八)启动文件、可视化

arg:【不存在于ROS的参数服务器中】仅在launch文件中出现,可作为node运行时传的参数,如之前在终端输入指令时传的参数。打开launch文件后,文本编辑器的菜单下选择“查看”→“高亮模式”,选择XML可方便查看代码。:通过XML文件实现多节点的配置和启动(可自动启动ROS Master)。required:节点是否为必须节点,即改节点奔溃后须终止其他节点。rosparam:【在ROS参数服务器中】处理多个参数。ns:自定义的命名空间,在自定义的命名空间中运行节点。args:输入参数用。

2023-04-20 23:10:11 204

原创 (七)坐标管理、tf坐标系广播与监听

一个机器人可以有多个坐标系,若要去描述任意两个坐标系之间的关系,会出现大量的矩阵运算。而可以用ROS中的TF(Transform)功能包来解决问题,它可以管理坐标系,通过查询可获知两个坐标系间的关系,无需自己去做运算。

2023-04-19 21:01:23 408

bag2IMAGE.py

将点云bag转换成图像数据存储

2024-03-04

string类型的比较

C++程序:对读入的string对象进行比对,测试是否相等,输出结果

2023-04-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除