论文笔记
文章平均质量分 91
自动驾驶小学生
谢谢关注。代表作品:《Coursera自动驾驶课程24讲》:https://blog.csdn.net/cg129054036/category_10603636.html?spm=1001.2014.3001.5482
展开
-
BEV目标检测论文串讲:知识蒸馏(CMKD、TiG-BEV、UniDistill、RadarDistill、CRKD)
大家好,今天和大家分享五篇知识蒸馏在BEV目标检测中应用的论文。关于知识蒸馏,大家可以看一下这个视频,对常见的知识蒸馏方法进行了很好的介绍。原创 2024-03-29 19:53:51 · 779 阅读 · 0 评论 -
(已开源)详解毫米波雷达与图像融合3D感知多任务模型CRN: Camera Radar Net for Accurate, Robust, Efficient 3D Perception
本文介绍一篇毫米波雷达与图像融合的3D感知多任务模型CRN,收录于ICCV2023,网上已经有很多对论文第一版的解读,本文解读的是这篇论文的第二版。。原创 2024-03-03 09:28:39 · 568 阅读 · 0 评论 -
地平线J5芯片部署参考算法(2024.01.22)
本文主要是记录地平线官方提供的可在J5芯片上的参考算法。原创 2023-07-27 22:28:50 · 2292 阅读 · 0 评论 -
详解KITTI视觉3D检测模型CMKD: Cross-Modality Knowledge Distillation Network for Monocular 3D Object Detection
论文收录于。原创 2023-05-29 21:44:59 · 1112 阅读 · 0 评论 -
视觉BEV经典算法:LSS详解与代码
本文介绍一篇视觉BEV经典算法:LSS,论文收录于,本文通过显示的进行完成目标语义分割,重点是。原创 2023-03-06 21:58:43 · 4214 阅读 · 11 评论 -
详解视觉BEV3D检测模型: Fast-BEV: A Fast and Strong Bird‘s-Eye View Perception Baseline
本文介绍一篇视觉BEV3D检测模型:,论文收录于。目前大多数现有的BEV感知方案要么需要相当多的资源来执行车端推理,要么性能不高。本文提出了一种简单而有效的框架,称为,它能够在车载芯片上执行更快的BEV感知。为了实现这一目标,本文通过试验发现,其中,(1)和(3)使Fast-BEV能够在车载芯片上快速推理和方便部署,(2),(4)和(5)确保Fast-BEV具有竞争力的性能。这些都使得Fast-BEV成为自动驾驶车载芯片上高性能、快速推理和易于部署的解决方案。原创 2023-02-05 22:01:02 · 3323 阅读 · 0 评论 -
nullmax纽劢科技:《行泊一体中的感知方案介绍》
如何设计和高效利用 Memory Bank,在工程中是极有挑战的一项工作。转载 2023-02-04 11:30:39 · 1439 阅读 · 0 评论 -
详解多视角3D检测模型 BEVDepth: Acquisition of Reliable Depth for Multi-view 3D Object Detection
论文收录于。在这篇文章中,作者提出了一种新的具有的三维物体检测器。本文提出的BEVDepth通过利用来提高图像深度估计的可信度。作者引入了,以增强深度预测能力。此外,针对不精确特征投影带来的副作用,设计了一种新的。此外借助定制的高效体素池化和多帧机制,BEVDepth在nuScenes测试集上实现了60.9%NDS,NDS得分首次达到60%。原创 2022-12-30 16:24:03 · 1113 阅读 · 2 评论 -
视觉BEV语义分割模型 Simple-BEV: What Really Matters for Multi-Sensor BEV Perception?
本文介绍一篇简单的BEV语义分割模型,这篇文章出彩的是,分析了哪些因素对BEV语义分割影响比较大,此外还分析了如何更好使用Radar数据提高感知性能。原创 2022-12-18 18:57:29 · 1857 阅读 · 0 评论 -
单目3D物体检测模型(CaDDN): Categorical Depth Distribution Network for Monocular 3D Object Detection
论文收录于。单目3D物体检测的主要挑战在于,由于缺乏直接的距离测量,因此必须根据物体和场景线索来推断物体深度。过去许多方法试图直接估计深度来辅助3D检测,但由于深度预测不准确,性能都比较有限。本文提出了(CaDDN),通过预测每个像素的分类深度分布,将丰富的上下文特征信息投影到3D空间中合适的深度区间。然后,本文使用计算效率高的来产生最终的输出检测。本文将CaDDN设计为一种完全可微的端到端方法,用于。原创 2022-12-18 11:02:26 · 1060 阅读 · 0 评论 -
2022百度ApolloDay技术开放日:文心大模型在自动驾驶感知中的落地应用
2数据处理大模型技术是自动驾驶行业近年的热议趋势,但能否落地应用、能否用好是关键难题。百度自动驾驶依托文心大模型特色优势,率先实现技术应用突破。百度自动驾驶技术专家王井东表示:文心大模型-图文弱监督预训练模型,背靠文心图文大模型数千种物体识别能力,大幅扩充自动驾驶语义识别数据,如:特殊车辆(消防车、救护车)识别、塑料袋等,自动驾驶长尾问题解决效率指数级提升;此外,得益于文心大模型-自动驾驶感知模型10亿以上参数规模,通过大模型训练小模型,自动驾驶感知泛化能力显著增强。百度认为传感器融合是实现L4自动驾驶的必转载 2022-12-06 22:29:54 · 627 阅读 · 0 评论 -
自动驾驶之心:毫米波雷达-视觉融合感知方法(前融合/特征级融合/数据级融合)
4D毫米波雷达的兴起未来会促进相机与毫米波雷达的感知能力。之前在两个不同的4D毫米波雷达数据集上进行测试发现,一个数据集中平均每帧4D毫米波雷达会包含330个3D点,一个数据集中平均每帧会返回2700个3D点,点数远远多于传统的3D毫米波雷达,且同时还提供高度信息,无疑会大幅提高二者融合感知能力。转载 2022-11-13 21:16:32 · 4007 阅读 · 0 评论 -
详解4D毫米波雷达数据集(VOD)Multi-class Road User Detection with 3+1D Radar in the View-of-Delft Dataset
论文收录于。下一代毫米波雷达除了提供和外,还会提供信息。原创 2022-10-18 21:31:42 · 5920 阅读 · 16 评论 -
重读经典(CLIP下):《Learning Transferable Visual Models From Natural Language Supervision》
这里使用OpenAI提供的notebook演示CLIP。安装CLIP导入需要的库,PyTorch['RN50','RN101','RN50x4',''''''{'''.sum([int('''.'''('''.'''))'''for'''in'''.'''()]):,}'''下面是图片预处理,即preprocess然后是文本预处理,得到77个tokens") ''''''{}{[]}{[,]:.2f}下面进行zero-shot分类,这里使用CIFAR100{}原创 2022-10-04 22:38:45 · 761 阅读 · 0 评论 -
重读经典(CLIP上):《Learning Transferable Visual Models From Natural Language Supervision》
CLIP自从去年2月底提出就立马火爆全场,它的方法出奇的简单、但是效果又出奇的好,很多结果和结论都让人瞠目结舌。比如作者说CLIP的迁移学习能力是非常强的,预训练好的这个模型能够在任意一个视觉分类的数据集上取得不错的效果;而且最重要的是它是zero-shot的,意思就是说它完全没有在这些数据集上去做训练,就能得到这么好的效果。论文里做了非常多的实验,在超过30个数据集上去做了测试,涵盖的面非常广,包括了OCR、视频动作检测、还有坐标定位和许多细分类任务。在所有这些结果之中,其中最炸裂的一条就是在。原创 2022-09-17 10:15:00 · 1186 阅读 · 0 评论 -
地平线:面向规模化量产的智能驾驶系统和软件开发
7月27日,地平线在智东西公开课开设的「地平线自动驾驶技术专场」第3讲顺利完结,地平线智能驾驶应用软件部负责人宋巍围绕》这一主题进行了直播讲解。本次分享主要分为以下4个部分:1、智能驾驶应用软件技术拆解2、软件视角的“软硬结合”与“软硬解耦”3、智能驾驶软件开发平台Horizon TogetherOS Bole™4、智能驾驶应用软件开发趋势展望。...............转载 2022-08-07 13:21:49 · 982 阅读 · 1 评论 -
详解自动驾驶仿真数据集 SHIFT:A Synthetic Driving Dataset for Continuous Multi-Task Domain Adaptation
SHIFT:A Synthetic Driving Dataset for Continuous Multi-Task Domain Adaptation本文介绍一个新的自动驾驶仿真数据集:,论文收录于 CVPR2022。是所有自动驾驶系统要面临的挑战。然而,现有的图像和视频驾驶数据集。论文作者介绍了一个。在和、、等方面呈现离散和连续的变化。 数据集包含综合的传感器套件和多种注释,可以在不断增加的域变化水平上,促进的研究。数据集主页:https://www.vis.xyz/shift/......原创 2022-07-03 11:36:09 · 1900 阅读 · 1 评论 -
重读经典:《The Craft of Research(1)》
跟读者建立联系【研究的艺术·一】这一次李沐博士给大家精读的是一本关于论文写作的书籍。这本书总共包含四个大的章节,本期视频李沐博士介绍的是第一个章节:Research,Researchers,and Readers。视频开头,李沐博士介绍到:在学生年代,我的语文和英语基本上徘徊在及格线的边缘,所以在做论文写作的时候一直是不那么自信的,以至于我花了很多时间去学习怎么样做比较好的写作。但后来我发现两件事情:好的写作能给你带来至少两个好处:好消息是说论文写作其实并不难,至少比做研究本身要容易很多。在这期视频和接下原创 2022-06-25 21:10:02 · 2400 阅读 · 2 评论 -
重读经典:《End-to-End Object Detection with Transformers》
DETR 论文精读【论文精读】这一次朱毅博士给大家精读的论文是 ,是目标检测领域里程碑式的一个工作,文章收录于 。 是 的缩写,使用 简化了目标检测流程,不再需要 操作,直接将目标预测看作是。这篇论文在2020年5月第一次挂到 上的时候,就引起了计算机视觉圈的强烈反响,网上很多人都觉得这篇论文应该是 的最佳论文。从20年5月到22年5月两年的时间 的引用呢就已经超过了2000,而且它的官方代码呢也有将近 9000个star。如果跟去年大火的 相比, 的官方代码到现在也只有8000个star,所原创 2022-06-11 20:40:25 · 1692 阅读 · 0 评论 -
自动驾驶开源软件和算法库
github:https://github.com/carla-simulator/carladoc:https://carla.readthedocs.io/en/latest/website:http://carla.org/2. Kalman-and-Bayesian-Filters-in-Python (卡尔曼和贝叶斯滤波教材)github:https://github.com/rlabbe/Kalman-and-Bayesian-Fil原创 2022-05-20 10:42:13 · 2199 阅读 · 0 评论 -
地平线:面向规模化量产的自动驾驶感知研发与实践
导读4月27日,地平线智能驾驶感知研发部负责人苏治中就《面向规模化量产的自动驾驶感知研发与实践》这一主题进行了直播讲解。本次课程内容分为4个部分:1、地平线自动驾驶环境感知量产实践2、软硬协同的自动驾驶感知算法设计3、实现规模化量产的“最后一公里”4、感知技术的发展趋势1. 地平线自动驾驶环境感知量产实践首先,为大家简单介绍下自动驾驶分级,上图左边来自于SAE,是大家提到自动驾驶分级时最广泛看到或最广泛引用的权威来源。从定义上来看,L3级以上才算是自动驾驶。L3级自动驾驶功能里,汽..转载 2022-05-07 23:03:25 · 1179 阅读 · 0 评论 -
详解3D物体检测模型:Focal Sparse Convolutional Networks for 3D Object Detection
论文链接为:https://arxiv.org/abs/2204.12463项目链接为:https://github.com/dvlab-research/FocalsConv原创 2022-04-29 10:32:36 · 4663 阅读 · 3 评论 -
详解3D物体检测模型: Voxel Transformer for 3D Object Detection
论文链接为:https://arxiv.org/pdf/2109.02497.pdf项目链接为:https://github.com/PointsCoder/VOTR原创 2022-04-13 17:22:00 · 6150 阅读 · 5 评论 -
重读经典(点云深度学习开山之作):《Deep learning on point clouds for 3D scene understanding》(持续更新中)
本文介绍的是 PointNet 作者的博士论文:3D场景理解中的点云深度学习。从上图可以看到,整个博士论文主要贡献有两块:一是点云深度学习的网络架构(PointNet 和 PointNet++);二是在3D场景理解中的应用(frustum-pointnets 和 FlowNet3D)。在本文中,将会按照博士论文篇幅顺序对 PointNet 和 PointNet++ 再进行一次解读。关于后面两章其应用感兴趣的朋友可以看论文原文,这里就不在介绍了。Abstract参考文献论文链接:Deep L.原创 2022-03-13 22:38:01 · 3374 阅读 · 0 评论 -
详解协同感知数据集OPV2V: An Open Benchmark Dataset and Fusion Pipeline for Perception with V2V Communication
在《详解自动驾驶仿真框架OpenCDA: An Open Cooperative Driving Automation Framework Integrated with Co-Simulation》 一文中介绍了自动驾驶仿真框架 OpenCDA。本文将介绍论文作者另一篇最新工作 OPV2V,论文收录于 ICRA2022。OPV2V 数据主要 feature 有:提出了首个多车协同感知大型数据集,在相同的时间戳下包含着多辆自动驾驶汽车的3D点云与相机RGB图像;囊括了73个不同的场景,6种道路类型.原创 2022-02-17 20:47:32 · 5443 阅读 · 9 评论 -
重读经典:《Masked Autoencoders Are Scalable Vision Learners》
MAE 论文逐段精读【论文精读】原创 2022-01-21 21:15:21 · 3158 阅读 · 4 评论 -
重读经典:《Momentum Contrast for Unsupervised Visual Representation Learning》
MoCo 论文逐段精读【论文精读】 这次论文精读李沐博士继续邀请了亚马逊计算机视觉专家朱毅博士来精读 Momentum Contrast(Moco),强烈推荐大家去看本次的论文精读视频。朱毅博士讲解的很详细,几乎是逐词逐句地讲解,在讲解时把 ViT 相关领域的研究也都介绍了,听完之后收获满满。ViT 应该是过去一年计算机视觉领域影响力最大的一个工作。ViT 挑战了卷积神经网络在计算机...原创 2021-12-18 19:12:08 · 5171 阅读 · 1 评论 -
重读经典:《An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale》
ViT论文逐段精读【论文精读】 这次李沐博士邀请了亚马逊视觉专家朱毅博士来精读 ViT,ViT 应该是过去一年计算机视觉领域影响力最大的一个工作。ViT 挑战了卷积神经网络在计算机视觉领域的绝对统治地位。ViT 证明如果能在足够大的数据集上去训练,那么就可以不需要卷积神经网络,直接使用标准的 Transformer 也能把视觉问题解决好。ViT 不仅在计算机视觉挖了一个大坑;同是它也打破...原创 2021-11-30 22:57:45 · 3952 阅读 · 0 评论 -
重读经典:《Generative Adversarial Nets》
GAN论文逐段精读【论文精读】 GAN论文链接:https://arxiv.org/abs/1406.2661原创 2021-11-10 12:29:35 · 8036 阅读 · 0 评论 -
详解道路标记数据集 CeyMo: See More on Roads -- A Novel Benchmark Dataset for Road Marking Detection
本文介绍一个新的道路标记检测数据集,论文收录于 WACV2022。Ceymo数据集总共包含2887张图片,标注了11类共4706个道路标记实例,图片分辨率为 1920×10801920\times10801920×1080。其中,对于每一个道路标记实例,作者采用了三种标注方式:多边形、bounding box以及像素级标注。 除此之外,作者还提供了数据集评价指标和脚本程序,在数据集上作者还使用了实例分割和目标检测两种检测方法进行对比,作为baseline。从实验结果来看,实例分割的方法准确度高于目标检测方.原创 2021-11-02 21:31:44 · 6078 阅读 · 9 评论 -
重读经典:《Deep Residual Learning for Image Recognition》
ResNet论文逐段精读【论文精读】原创 2021-10-24 15:32:44 · 1196 阅读 · 2 评论 -
详解惯性导航论文 RINS-W: Robust Inertial Navigation System on Wheels
论文链接:https://arxiv.org/pdf/1903.02210.pdf原创 2021-10-17 22:02:02 · 2587 阅读 · 3 评论 -
重读经典:《ImageNet Classification with Deep Convolutional Neural Networks》
9年后重读深度学习奠基作之一:AlexNet【下】【论文精读】原创 2021-10-16 09:32:05 · 3682 阅读 · 5 评论 -
详解车道线检测数据集和模型 VIL-100: A New Dataset and A Baseline Model for Video Instance Lane Detection
本文介绍一个新的车道线数据集 VIL-100 和检测模型 MMA-Net,论文已收录于 ICCV2021。论文链接:https://arxiv.org/abs/2108.08482项目链接:https://github.com/yujun0-0/MMA-Net数据集链接:原创 2021-09-27 22:33:08 · 2943 阅读 · 4 评论 -
自动驾驶纯视觉3D物体检测算法
这是Pseudo-LiDAR作者最近做的一个分享报告:《Pseudo-LiDAR:基于相机的3D物体检测算法》。在这份报告里,作者主要介绍了博士期间的成果:基于深度学习的深度估计,纯视觉3D物体检测算法。1.2.3....原创 2021-09-12 21:10:08 · 1318 阅读 · 0 评论 -
两篇基于语义地图的视觉定位方案:AVP-SLAM和RoadMap
AVP-SLAMRoadMap原创 2021-09-11 21:18:44 · 6817 阅读 · 6 评论 -
Waymo研发经理:《自动驾驶感知前沿技术介绍》
Waymo研发经理|自动驾驶感知前沿技术介绍原创 2021-09-02 21:51:47 · 1166 阅读 · 1 评论 -
详解3D物体检测模型 SPG: Unsupervised Domain Adaptation for 3D Object Detection via Semantic Point Generation
本文对基于激光雷达的无监督域自适应3D物体检测进行了研究,在Waymo Domain Adaptation dataset上,作者发现点云质量的恶化是3D物件检测器性能下降的主要原因。因此,作者提出了Semantic Point Generation (SPG)方法,首先在前景点区域生成语义点云数据,并且复原前景点物体缺失的部分。然后,将原始点云与生成的语义点云数据进行融合得到增强后的点云数据,再使用3D物体检测器进行检测。在Waymo 和 KITTI 数据集上,本体提出的SPG方法都大幅提高了3D物检检.原创 2021-08-31 22:32:50 · 2436 阅读 · 2 评论 -
详解停车位检测论文:Attentional Graph Neural Network for Parking-slot Detection
本文介绍一篇注意力图神经网络用于停车位检测论文,论文已收录于 RA-L2021。在之前的基于卷积神经网络的停车位检测方法中,很少考虑停车位标记点之间的关联信息,从而导致需要复杂的后处理。在本文中,作者将环视图中的标记点看作图结构数据,使用图神经网络聚合相邻的标记点信息,不需要任何后处理,可以端到端训练。在ps2.0 和 PSV 停车位数据集上都取得了最优的检测性能。论文链接为:https://arxiv.org/pdf/2104.02576.pdf项目链接为:https://github.com/Ji.原创 2021-08-29 21:13:56 · 3464 阅读 · 8 评论 -
详解经典GPS辅助惯性导航论文 A GPS-aided Inertial Navigation System in Direct Configuration
本文介绍一篇 IMU 和 GPS 融合的惯性导航论文,重点是理解本文提出的:Dynamical constraints update、Roll and pitch updates 和 Position and heading updates。论文链接为:https://www.sciencedirect.com/science/article/pii/S1665642314700963文章目录1. Method Description1.1 Vector state and system specif.原创 2021-08-28 17:45:38 · 757 阅读 · 0 评论