自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(54)
  • 资源 (1)
  • 收藏
  • 关注

原创 LaneNet 论文阅读

在本文中,将车道检测问题转化为实例分割问题——其中每个车道形成自己的实例——可以进行端到端训练为了在拟合车道之前对分段车道实例进行参数化,应用基于图像的学习透视变换,而不是固定的“鸟瞰图”变换提出了一种快速车道检测算法,以 50 fps 运行,可以处理可变数量的车道并应对车道变化。

2024-03-12 13:44:42 1021 2

原创 UnDeepVO: Monocular Visual Odometry through Unsupervised Deep Learning 论文阅读

提出了一种名为 UnDeepVO 的新型单目视觉里程计(VO)系统。UnDeepVO 能够使用深度神经网络估计单目相机的 6-DoF 位姿及其视图深度两个显着特征:一是无监督深度学习方案,二是绝对规模恢复Fig. 1UnDeepVO 的系统概括。在使用未标记的立体图像进行训练后,UnDeepVO 可以同时使用单目图像进行视觉里程计和深度估计。估计的 6-DoF 位姿和深度图均已缩放,无需进行缩放后处理。

2024-03-11 19:30:53 853 3

原创 Unsupervised Learning of Monocular Depth Estimation and Visual Odometry 论文阅读

尽管基于学习的方法在单视图深度估计和视觉里程计方面显示出有希望的结果,但大多数现有方法以监督方式处理任务。最近的单视图深度估计方法探索了通过最小化光度误差在没有完全监督的情况下学习的可能性探索使用立体序列来学习深度和视觉里程计,框架能够从单目序列估计单视图深度和双视图里程计单视图深度和视觉里程计的联合训练可以改善深度预测,因为对深度施加了额外的约束,并实现了视觉里程计的有竞争力的结果基于深度特征的扭曲损失改进了单视图深度估计和视觉里程计的简单光度扭曲损失。

2024-03-06 15:06:20 641 1

原创 CNN-SVO 论文阅读

与现有的VO和V-SLAM算法相比,半直接视觉里程计(SVO)具有两个主要优势,可以实现最先进的帧速率相机运动估计:直接像素对应和概率映射方法的高效实现根据单图像深度预测网络的深度预测,对特征位置深度的均值和方差进行初始化,从而改进了SVO映射通过显著降低初始化地图点的深度不确定性(即,以深度预测为中心的小方差)其好处是双重的:视图之间的可靠特征对应关系和快速收敛到真实深度以创建新的地图点。

2024-03-04 19:40:45 1174

原创 ESP-VO 论文阅读

本文从深度学习的角度研究视觉里程计(VO)。由于 VO 问题通常被表述为纯几何问题,当前 VO 系统仍然缺少的关键特征之一是通过学习自动获取知识和提高性能的能力本文研究了深度神经网络是否可以有效且有益于 VO 问题针对基于深度循环卷积神经网络 (RCNN) 的单目 VO,提出了一种端到端、序列到序列概率视觉里程计 (ESP-VO) 框架它以端到端的方式进行训练和部署,即直接从一系列原始图像(视频)中推断姿势和不确定性它。

2024-03-03 15:44:22 866

原创 LIO-SAM 论文阅读

提出了一种通过平滑和映射进行紧耦合激光雷达惯性里程计的框架 LIO-SAM,它实现了高精度、实时的移动机器人轨迹估计和地图构建LIO-SAM 在因子图上制定激光雷达惯性里程计,允许将多种相对和绝对测量(包括闭环)从不同来源作为因子合并到系统中惯性测量单元 (IMU) 预积分的估计运动可以消除点云的倾斜,并为激光雷达里程计优化生成初始猜测对姿势优化进行了边缘化处理,而不是将激光雷达扫描与全局地图匹配。

2024-01-24 15:54:48 974

原创 ORB-SLAM 论文阅读

本文提出了 ORB-SLAM,一种基于特征的单目同步定位和建图 (SLAM) 系统该系统对严重的运动杂波具有鲁棒性,允许宽基线环路闭合和重新定位,并包括全自动初始化选择重建的点和关键帧的适者生存策略具有出色的鲁棒性,并生成紧凑且可跟踪的地图。

2024-01-21 18:34:12 1166

原创 LOAM: Lidar Odometry and Mapping in Real-time 论文阅读

提出了一种使用二维激光雷达在6自由度运动中的距离测量进行即时测距和建图的方法距离测量是在不同的时间接收到的,并且运动估计中的误差可能导致生成的点云的错误配准本文的方法在不需要高精度测距或惯性测量的情况下同时实现了低漂移和低计算复杂性关键思想是将同时定位和建图的复杂问题划分为两个算法一个算法以高频率进行测距,但精度较低,用于估计激光雷达的速度另一个算法以数量级较低的频率进行精准匹配和点云配准​激光雷达里程计进行粗略处理以估计较高频率的速度激光雷达测绘则执行精细处理以以较低频率创建地图。

2023-12-30 22:44:54 1430 1

原创 BEVFormerV2 论文阅读

提出了一种新颖的 BEV 检测器,具有透视监督,收敛速度更快,更适合现代图像基础架构优先考虑通过引入透视视图监督来简化BEV检测器的优化提出了一个两阶段的BEV检测器,其中来自透视头的建议被送入鸟瞰视图头进行最终预测将通用 2D 图像主干网适应 BEV 检测器的优化问题。为了解决这个问题,我们通过从额外的视角 3D 检测头添加辅助损失,将视角监督引入到 BEV 模型中将两个检测头集成为两级检测器,即BEVFormer v2。

2023-12-24 16:06:30 1156

原创 BEVDepth: Acquisition of Reliable Depth for Multi-View 3D Object Detection 论文阅读

提出了一种新的 3D 物体检测器,具有值得信赖的深度估计,称为 BEVDepth,用于基于相机的鸟瞰 (BEV) 3D 物体检测BEVDepth通过利用显式深度监控来解决深度估计不足的问题,还引入了一个具有相机意识的深度估计模块,以促进深度预测能力设计了一个新颖的深度细化模块,以对抗不准确特征反投影所带来的副作用提出了一种新的网络架构,名为BEVDepth,用于准确预测3D物体检测的深度首先研究了现有3D物体检测器的工作机制,并揭示了它们中的不可靠深度。

2023-11-28 15:39:05 1300

原创 Lift, Splat, Shoot: Encoding Images from Arbitrary Camera Rigs by Implicitly Unprojecting to 3D 论文阅读

提出了一种新的端到端架构,可以根据任意数量摄像机的图像数据直接提取场景的鸟瞰图表示方法的核心思想是将每个图像独立地“提升”(lift)到每个摄像头的特征金字塔中,然后将所有特征金字塔“喷洒”(splat)到一个光栅化的鸟瞰视图网格中了实现学习密集表示以供运动规划的目标,展示了该模型推断的表示可以通过将模板轨迹"射入"(shoot)由我们的网络输出的鸟瞰图成本地图来进行可解释的端到端运动规划。

2023-11-24 14:28:29 884

原创 Cross-View Transformers for Real-Time Map-View Semantic Segmentation 论文阅读

提出了 Cross-View Transformers ,一种基于注意力的高效模型,用于来自多个摄像机的地图视图语义分割使用相机感知的跨视图注意机制隐式学习从单个相机视图到规范地图视图表示的映射该架构由每个视图的卷积图像编码器和跨视图变换层组成,以推断地图视图语义分割。

2023-11-19 22:50:53 394

原创 BEVFormer 论文阅读

BEVFormer,通过时空转换器学习统一的BEV表示,以支持多个自动驾驶感知任务过预定义的网格状BEV查询与空间和时间空间相互作用,以利用空间和时间信息为了聚合空间信息,设计了空间交叉注意力,每个BEV查询从不同摄像机视图中提取感兴趣区域的空间特征对于时间信息,提出了时间自注意力,以循环地融合历史BEV信息相比于基于激光雷达的对应方法,摄像头拥有能够检测远距离物体和识别基于视觉的道路元素(例如,交通信号灯、停车线)的优势基于单目框架和跨摄像头后处理的方法性能和效率较低。

2023-11-12 13:09:21 859

原创 ViT:AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE 论文阅读

Transformer 在计算机视觉中的应用有限在视觉中,注意力要么与卷积网络结合使用,要么用于替换卷积网络的某些组件,同时保持它们的整体结构本文证明了这种对CNN的依赖是不必要的,并且直接应用于图像块序列的纯转换器可以在图像分类任务上表现得很好。

2023-11-12 13:06:50 67

原创 Attention is all you need 论文阅读

主要序列转导模型基于复杂的循环或卷积神经网络,包括编码器和解码器。性能最好的模型还通过注意力机制连接编码器和解码器提出Transformer,它完全基于注意力机制,完全不需要递归和卷积对两个机器翻译任务的实验表明,这些模型具有卓越的质量,同时具有更高的并行性,并且需要的训练时间显着减少。

2023-11-03 17:03:08 149

原创 PointNet++ 论文阅读

*背景:**PointNet的设计并未捕捉到度量空间中存在的局部结构,限制了其识别细粒度模式和适用于复杂场景的能力解决思路引入了一种分层神经网络,该网络==在输入点集的嵌套分割上递归地应用PointNet==利用度量空间距离,网络能够学习具有不断上下文尺度增加的==局部特征==提出了新颖的==集合学习层,以自适应地组合多个尺度的特征==

2023-11-03 16:54:33 150

原创 PointNet 论文阅读

对于点云问题,由于其格式不规则,大多数研究人员将此类数据转换为规则的 3D 体素网格或图像集合。然而,这会导致数据不必要地庞大并导致问题在本文中,我们设计了一种直接消耗点云的新型神经网络,它很好地尊重了输入中点的排列不变性。我们的网络名为 PointNet,为从对象分类、部分分割到场景语义解析等应用提供了统一的架构。

2023-11-03 16:51:45 119

原创 CORE: Cooperative Reconstruction for Multi-Agent Perception 论文阅读

本文提出了 CORE,一种概念简单、有效且通信高效的多智能体协作感知模型。合作主体共同提供对环境的更全面的观察整体观察可以作为有价值的监督,明确指导模型学习如何基于协作重建理想的观察每个代理共享的压缩器,用于创建更紧凑的特征表示以实现高效广播用于跨代理消息聚合的轻量级细心协作组件基于聚合特征表示重建观察的重建模块CORE 模型在 OPV2V 数据集上进行验证,包括 3D 对象检测和语义分割两个任务。感知——识别和解释感官信息,是智能体感知周围环境的关键能力。

2023-10-15 17:03:17 1282 2

原创 Machine-Learning-Enabled Cooperative Perception for Connected Autonomous Vehicles 论文阅读

阐明了为联网自动驾驶车辆设计支持机器学习的协作感知系统的可能性关注如何减少通信和数据处理延迟本文关注了机器学习,特征图量化,毫米波通信以及车辆边缘计算的最新成果作为 CNN 模型生成的重要的处理数据类型,特征图包含足够的信息,可供自动驾驶车辆准确地检测和分类对象。为了实现协作感知,车辆之间共享特征地图数据比共享原始传感器数据更具优势,因为前者提供了更好的隐私保护,并且在传输数据量上具有灵活性。然而,为了在 CAV 上设计基于特征图的协作感知系统,需要克服一些技术挑战,以确保最终系统的可靠性和实用性。

2023-10-10 00:21:23 78

原创 A Survey and Framework of Cooperative Perception 论文阅读

首次提出统一的框架回顾了基于不同类型传感器的 CP 系统与分类对节点结构,传感模态和融合方法进行回顾提出了一个分层的 CP 框架,回顾现有的数据集和模拟器V-PN:更具有自我效率I-PN:更适合拓展合作同构 PN:扩展感知范围异构 PN:通过补充不同传感器配置,实现更好的 FOV摄像头擅长捕捉视觉信息,LiDAR在收集三维信息方面非常出色。在一个互补的计划中同时利用这些传感器的优势被认为是提高监控系统感知精度的一个有希望的解决方案。

2023-10-08 19:54:42 1055

原创 Survey on Cooperative Perception in an Automotive Context 论文阅读

本文就协同基础设施领域提供相关环境的调查回顾了感知中涉及的主要模块:定位,目标检测和跟踪,地图生成提供了协同感知的 SWOT协作定位通过额外的数据优化独立的位置估计,从而改进的位置估计的效果视点的倍增为克服传感器的局限性或减少场景条件变化的影响提供了显着的优势。另一方面,跟踪似乎被搁置了,因为所使用的协作跟踪方法通常只是在感知管道的其他部分获得其他结果的一种手段。在合作环境中缺乏实验是由于通信中的带宽要求以及对去同步和姿态估计误差的敏感性协作地图绘制有助于丰富车辆移动的环境。

2023-10-08 19:53:24 526

原创 Cooperative Perception for 3D Object Detection in Driving Scenarios using Infrastructure Sensors 阅读

各种 3D 对象检测方法依赖于不同传感器模态融合来克服个体传感器的限制。协同感知将分布于不同传感器的信息进行合作来作为一种缓解限制的方法。早期融合:在检测前结合多个空间不同的感知点的点云后期融合:融合来自多个空间不同传感器的独立检测的边界盒(bounding box)同时,考虑了两种场景:t 形路口和环形路口相比于V2V共享车载信息并在本地融合数据,所提出的协同感知系统采用了一个中央系统,融合来自多个路边设施传感器的感知信息,可以通过共享资源来减少传感器本地处理成本。

2023-10-08 19:52:13 119

原创 Collaborative Perception for Autonomous Driving: Current Status and Future Trend 论文阅读

个体车辆能力有限,导致感知性能提升遇到瓶颈。为了突破个体感知的限制,协作感知被提出,使车辆能够共享信息来感知超出视线和视野的环境对有前景的协作感知技术的相关工作进行了回顾,包括介绍基本概念、概括协作模式并总结协作感知的关键要素和应用最后,我们讨论了该研究领域的开放挑战和问题,并给出了一些潜在的进一步方向自动驾驶的关键模块之一是感知,其目标是感知周围环境并提取与导航相关的信息,包括物体检测、跟踪、语义分割等。随着大规模训练数据的增加和深度学习算法的发展,感知性能得到了显着提升。

2023-10-08 19:50:55 77

原创 混合背包问题

有 NNN 种物品和一个容量是 VVV 的背包。物品一共有三类:第一类物品只能用1次(01背包);第二类物品可以用无限次(完全背包);第三类物品最多只能用 sis_isi​ 次,每种体积是 viv_ivi​,价值是 wiw_iwi​。(多重背包)求解将哪些物品装入背包,可使物品体积总和不超过背包容量,且价值总和最大.输出最大价值。这个就算之前三种背包问题的综合问题了吧 (大概,可能,也许,应该,差不多)在实际上,多重背包的问题就是01背包的拓展,那么就可以将多重背包转化为 log2Slog

2021-04-22 19:33:25 152

原创 分组背包问题

有 N 组物品和一个容量是 V 的背包。每组物品有若干个,同一组内的物品最多只能选一个。每件物品的体积是 vijv_{ij}vij​,价值是 wijw_{ij}wij​,其中 iii 是组号,jjj 是组内编号。求解将哪些物品装入背包,可使物品总体积不超过背包容量,且总价值最大。出最大价值。题目很清晰,就是01背包的变种,就是将物品分组,每组中只能选一个。这样一来,参考01背包的模板,事情就变得异常简单,不过就是再套一层循环。在这里插入代码片#include <iostream>#in

2021-04-22 19:00:27 156

原创 多重背包问题

有 N 种物品和一个容量是 V 的背包。第 i 种物品最多有 sis_isi​ 件,每件体积是 viv_ivi​,价值是 wiw_iwi​。求解将哪些物品装入背包,可使物品体积总和不超过背包容量,且价值总和最大。输出最大价值。01背包是指每个物品只有一个,完全背包问题是指每个物品有无数个。那么多重背包问题就是将二者折中,每个物品都是有限个,但不一定只有一个。其实这就是一个01背包的拓展版。我们已知01背包对每个物品只有取或者不取两种情况(0和1两种情况),而多重背包就是将两种情况拓展为 n+1n+1n

2021-04-19 19:52:56 183

原创 完全背包问题

有 N 种物品和一个容量是 V 的背包,每种物品都有无限件可用。第 iii 种物品的体积是 viv_ivi​,价值是 wiw_iwi​。求解将哪些物品装入背包,可使这些物品的总体积不超过背包容量,且总价值最大。两个整数 N,VN,VN,V 用空格隔开,分别表示物品种数和背包容积。该题与01背包的不同在于所有的物品都是无限的,即每个物品可以装多次。朴素做法这里我们就不说了。直接给个简化的算法。#include <iostream>#include <cstring>#i

2021-04-19 15:14:31 181

原创 01背包问题

01背包问题经典动态规划题了。其实也没有多难。。。有 N 件物品和一个容量是 V 的背包。每件物品只能使用一次。第 iii 件物品的体积是 viv_ivi​,价值是 wiw_iwi​。求解将哪些物品装入背包,可使这些物品的总体积不超过背包容量,且总价值最大。我们可以将问题拆分成两种情况来分析在装到第 iii 个物品时,选择不装(其中就有背包剩余体积小于物品体积的情况),则 f[i][j]=f[i−1][j]f[i][j]=f[i-1][j]f[i][j]=f[i−1][j]在装到第 iii 个

2021-04-17 20:33:44 120

原创 二叉树操作(2)—— 进阶部分

二叉树进阶操作统计度数为1的节点的个数叶子节点到根节点的路径交换左右节点广度优先遍历广度优先遍历所谓广度,即是按照树的横向来遍历,遵循按顺序输出,所以引入队列,进行先入先出。(直接用STL容器了,自己写队列操作,不可能,绝对不可能????)测试实例:int Count_Grade_1(Bitree T) //统计度数为1的节点个数{ if (T == NULL) return 0; else if ((!T->leftchild) &am

2021-03-13 12:29:41 88

原创 二叉树操作(1)—— 基础部分

二叉树基础操作建立二叉树(这里用先序)二叉树的先序遍历二叉树的中序遍历二叉树的后序遍历测量二叉树深度统计二叉树的节点个数统计二叉树的叶子节点个数所有操作均以递归形式(非递归的太麻烦了???? )测试用例:#include <iostream>#include <stack>#include <algorithm>using namespace std;typedef struct Node

2021-03-13 10:50:04 88

原创 LCS(最大公共子序列)问题

1. LCS是个啥?LCS,即最大公共子序列。与最长公共子串不同,最大公共子序列只要求有相同的元素,且顺序相同,但不要求连续。如:X=<A,B,C,B,D,A,B>Y=<B,D,C,A,B,A>则LCS<X,Y>=Z=<B,C,B,A>2. LCS相关分析与算法(1) Xi 为字符串X的i前缀,Yj为字符串的j前缀(2)若Xm=Yn,则Zk=Xm=Yn,LCS(Xm,Yn)=LCS(Xm-1,Yn-1)+Xm(3)若Xn!=Yn,要么LCS

2021-02-03 09:56:36 1048

原创 排序(七): 堆排序 - Heap_Sort

堆排序听到这个就又开始头痛了。堆排序,顾名思义,用堆进行的排序。但实际上,只要知道了具体的做法,堆排序并不难。堆排序的困难在于建立最大堆(这里用最大堆为例)直接上图5比自己的子节点要小,故要移位又发现5还是比字节点要小,所以接着换像这样逐步得到最大堆最大堆设置完毕,就要开始进行堆排序。1. 将堆的顶部,与最后一个元素交换。2. 再将剩下的元素进行上述操作,调整为最大堆。3. 调整完毕,继续将最大元素与最后一个元素交换。4. 如此类推,直至排序完成上代码#include &

2021-01-25 15:21:18 111

原创 排序(六): 归并排序 - Merge_Sort

什么是归并排序归并排序讲究一个分割包围,统一歼灭的战略思想先将原数组中的数根据与指针数的大小进行比较,从而得到不同的数组,此为分割包围。再将数组进行归并,整合,排序,此为统一歼灭。语言难懂,直接上图这里,我将左指针数直接定义为第一个数,右指针定义为位于数组中间的数上代码#include <iostream>using namespace std;void merge(int a[], int l, int r, int mid){ int* aux = new int[r

2021-01-24 15:01:49 154 1

原创 幻方问题

问题描述幻方是一种很神奇的 N*NN∗N 矩阵:它由数字 1,2,3,⋯⋯,N×N 构成,且每行、每列及两条对角线上的数字之和都相同。当 N 为奇数时,我们可以通过下方法构建一个幻方:首先将 1写在第一行的中间。之后,按如下方式从小到大依次填写每个数 K(K=2,3,⋯,N×N) :若 (K-1)在第一行但不在最后一列,则将 K 填在最后一行, (K-1)所在列的右列;若 (K-1)在最后一列但不在第一行,则将 K填在第一列, (K-1)所在行的上3一行;若 (K-1)在第一行最后一列,则将

2021-01-24 14:23:40 3653 2

原创 F1赛车比赛排名问题(oj)

话不多说,直奔主题。1.要解决同一个人不同场比赛的得分与名次累计;2.要解决两种排名方式所对应的排序方法;(sort函数与cmp定义相配合)题中可得第一场:apple 25; banana 18 ; pear 15第二场:pear 25; banana 18第三场:apple 25; banana 18总计:apple 50 banana 54 pear 40apple : 第一2banana: 第二3pear: 第一1,第三1第一种排序(先看分数,再看排名): banana; a.

2020-07-29 09:54:50 543

原创 回文数(进制)判断

若一个数(首位不为零)从左向右读与从右向左读都一样,我们就将其称之为回文数。例如:给定一个十进制数 56,将 56 加 65(即把 56 从右向左读),得到121 是一个回文数。又如:对于十进制数 87:STEP1:87+78=165STEP2:165+561=726STEP3:726+627=1353STEP4:1353+3531=4884在这里的一步是指进行了一次 N 进制的加法,上例最少用了 4 步得到回文数4884。写一个程序,给定一个 N(2≤N≤10 或 N=16)进制数 M(1

2020-07-20 11:27:47 841

原创 说反话(翻转单词)

这是非常经典的题目,将一句话反过来,即逆序输出句中单词。如输入:Hello World Here I Come输出:Come I Here World Hello#include <bits/stdc++.h> //万能头文件int main (){ char ch[90]; //用来记录单词 while(gets(ch)!=NULL){ int len= strlen(ch),r=0,h=0; char str[90][90]; //用

2020-07-18 20:40:17 211

原创 关于XAMPP的Apache无法打开的问题

最近对PHP感兴趣,所以就自行了解了一下,u1s1,PHP的实现索要用到的东西比控制台应用要多,其中有一个很重要的套件XAMPP。它结合了Apache,MySQL (Mariadb),php,等一系列套件。这个可以从官网上下,很容易获取。但下载之后会出现一些问题。我遇到的问题就是Apache无法打开。首先选择下载版本的时候,可以看见,7.4.7版本的是下载量最大的版本。所以我最初下的也是这个版本,但后来,Apache无法打开,并且怎么去改端口都不行。后来我重新下载了7.3.11的版本,终于搞好了。

2020-07-11 21:38:47 876 1

原创 字符串按无序度排列

题意很明确,按无序度将字符串排序#include <iostream>#include <cstring>#include <cstdio>#include <cstdlib>#include <algorithm>#define N 51#define M 101using namespace std;typedef struct info{ char str[N]; int du;}info; .

2020-07-09 18:38:54 609

原创 高精度乘法

在打oj时,总会有些数字大小超过范围,但又要对其进行陈发运算,如100位乘以100位,对于已有的数据类型不足以支持运算,这时就要借助字符串来进行运算#include <iostream>#include <cstring> #define N 10000 using namespace std;void multi (char*a, char* b, int len1, int len2){ int dm; int num1[N]={0}; int

2020-07-09 15:35:50 254

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除