你关心的「自动驾驶目标检测算法」组团来了！| Paper连击vol.5

最新推荐文章于 2023-09-27 08:40:32 发布

TechBeat人工智能社区

最新推荐文章于 2023-09-27 08:40:32 发布

阅读量425

点赞数

分类专栏： Paper连击文章标签：自动驾驶目标检测算法

本文链接：https://blog.csdn.net/hanseywho/article/details/125102333

版权

Paper连击专栏收录该内容

1 篇文章 1 订阅

订阅专栏

小编将定期为大家整理【Paper连击】系列👊每一期将针对一个热门技术点或近期顶会中的多篇值得关注的前沿工作，做整理汇总，让你一次性在同一个话题下看到不同角度、不同维度的重磅文章，360度全息立体了解该领域最新研究进展。

paper连击，全力学习！⚡

【Paper连击】第一期：知识图谱的技术应用

【Paper连击】第二期: 模型压缩加速

【Paper连击】第三期：系统推荐算法回答

【Paper连击】第四期：生成对抗网络

本期送上：自动驾驶场景下的目标检测算法 👊

祝阅读愉快~

TechBeatTechBeat是荟聚全球华人AI精英的成长社区，每周上新来自顶尖大厂、明星创业公司、国际顶级高校相关专业在读博士的最新研究工作。我们希望为AI人才打造更专业的服务和体验，加速并陪伴其成长。https://datayi.cn/w/GR4vQ82o

在自动驾驶的感知检测领域，基于BEV(鸟瞰图)的3D检测一直很火热。在前不久，更是掀起了一股在BEV(Bird's Eye View, 鸟瞰图)下对相机做目标检测的风潮，引起不少CVer的广泛关注！

那么自动驾驶公司的目标检测算法都基于哪个网络在做？学术界又有哪些简单高效的方法值得借鉴呢？本期Paper连击中，我们着重梳理了自动驾驶场景下的目标检测算法供大家探讨研究~

Paper 1

CORL 2021 |

BEV下的纯视觉目标检测-DETR3D

掀起在BEV(Bird's Eye View, 鸟瞰图)下对相机做目标检测风潮的工作之一就是这篇来自MARS Lab与MIT，TRI还有理想汽车合作的论文——DETR3D。BEV视角，对于自动驾驶是非常自然的，但是如何能够高效的融合LiDAR (3D) 和 Camera(2D) 或者其他传感器（如radar）来做感知，是值得探究的问题。该模型将2D中的DETR目标检测架构应用到了3D目标检测中，通过reference points和相机参数的物理意义进行投影来获取图像features，目前代码已开源。

链接：https://www.techbeat.net/article-info?id=3495

Paper 2

CVPR 2022 | GANet：

基于关键点建模的全局关联网络

来自商汤智能汽车-创新研发中心团队提出一种新的基于关键点建模的车道线检测范式，即全局关联网络（GANet），通过直接回归车道线关键点到车道线起始点的偏移，来完成对车道线关键点的并行聚合，从而实现高效且准确的车道线检测。该方法在多个车道线检测benchmark上都超越了已有的方法，并取得良好的精度-速度平衡，具有巨大的应用潜力。

链接 : https://www.techbeat.net/article-info?id=3549

Paper 3

NeurIPS 2021 Spotlight | PCAN：高效时序建模,

提升多目标追踪与分割性能

该工作是对自动驾驶场景中高效快速地进行时序建模和多物体追踪分割的思考。研究者提出了一种简单高效地利用视频时序信息的机制, 通过对目标物体及过去帧的外观特征做高斯混合建模，得到数量较少且低秩(sparse and low-rank)的representative mixture prototypes, 实现了对历史信息(memory bank)的压缩。这一操作在降低attention运算复杂度和内存需求的同时, 也提高了视频物体分割的质量和追踪的稳定性。作为一个online method在两个最大规模的MOTS数据集BDD100K和Youtube-VIS上都取得了领先性能。

链接：https://www.techbeat.net/article-info?id=3134

Paper 4

CVPR 2022 Oral |

重新思考对齐Prototype的域自适应：基于Graph Matching的新范式

本文提出了一种基于图匹配的DAOD框架。随着基于patch的Transformer的潜力被不断挖掘，Graph的潜力也逐步体现出来。作者认为Graph的优势不在于多么fancy的图卷积设计，而在于如何更巧妙的突破传统卷积的local局限（类似Transformer），同时一些Graph 领域的积累（比如图匹配）似乎也能推动对CV的发展。希望SIGMA能够激发更多有趣的想法，共同推动这个领域的进步~

链接：https://www.techbeat.net/article-info?id=3496

Paper 5

ICLR 2022 | FP-DETR：

通过完全预训练提升Transformer目标检测器

该工作针对预训练提升detection transformer性能面临的挑战，提出一种encoder-only的目标检测模型，它能够很容易的在常用的图像分类任务上充分预训练。此外，研究者还提出一个简单的任务适配器来解决预训练分类任务与下游检测任务之间的差异，使得完成预训练的模型能够在下游的检测任务上实现有效的微调。在COCO 2017、Cityscapes等数据集上的实验，证实了该模型的鲁棒性和泛化能力。

链接：https://www.techbeat.net/article-info?id=3423

Paper 6

ICLR 2022 |

跨域目标检测的解耦自适应方法D-adapt

为了应对对抗域自适应方法应用到目标检测时所面临的挑战，该工作提出了一个解耦自适应框架 D-adapt。该方法是将原始的跨域目标检测问题分解为几个子问题；设计合适的算法来解决每个子问题；协调不同的算法/模块之间的关系，从而解决最终的问题。该方法在跨域目标检测的几个基准数据集上取得了相当大的提升。并且在实际部署中，可以通过使用更强大的适配器来进一步提高检测性能，而不会引入任何计算开销。

链接：https://www.techbeat.net/article-info?id=3304

Paper 7

ECCV 2020 |

MIT提出自动设计SPVNAS模型,

在SemanticKITTI上性能第一

该工作关注的焦点是如何自动设计用于自动驾驶的高效三维场景理解模型，并提出了一种新的三维点云计算模块稀疏点云-栅格卷积 (SPVConv) 和3D神经网络结构自动搜索 (3D-NAS)。本文中自动设计的模型SPVNAS在SemanticKITTI数据集上性能SOTA。希望借助该研究可以激励更多人研究轻量高效、硬件友好的深度学习，并在自动驾驶等现实场景落地~

链接：https://www.techbeat.net/article-info?id=1224

Paper 8

YOffleNet |

YOLO V4 基于嵌入式设备的轻量化改进设计

本文中提出的目标检测模型 YOffleNet，该模型在压缩率高的同时，将精度损失降到最小，可用于自动驾驶系统上的实时安全驾驶应用。该模型的Backbone架构是基于YOLOv4实现，但是可以用ShuffleNet的轻量级模块代替CSP的高计算负荷的DenseNet，从而大大压缩网络，具有很高的潜力部署在嵌入式系统中！

链接：TechBeat

更多关于“目标检测算法”相关的技术文章，

请登录TechBeat人工智能社区官网（TechBeat）查看~

大家近期还希望看到哪些前沿工作的Paper连击？

欢迎留言告诉我们哦~📩

我们下期【Paper连击】见！