【计算机视觉前沿研究热点顶会】ECCV 2024中目标检测有关的论文

本文链接：https://blog.csdn.net/A_Student10000/article/details/141904649

整值训练和尖峰驱动推理脉冲神经网络用于高性能和节能的目标检测

与人工神经网络(ANN)相比，脑激励的脉冲神经网络(SNN)具有生物合理性和低功耗的优势。由于 SNN 的性能较差，目前的应用仅限于简单的分类任务。在这项工作中，我们专注于弥合人工神经网络和神经网络在目标检测方面的性能差距。我们的设计围绕着网络架构和尖峰神经元。

当行人检测遇到多模态学习时：通才模型和基准数据集

近年来，利用不同传感器模态(如 RGB、 IR、 Depth、 LiDAR 和 Event)进行行人检测的研究受到越来越多的关注。然而，设计一个能够有效处理不同传感器模式的统一通用模型仍然是一个挑战。本文介绍了一种新的多模态感知的通用性模型MMPedestron。与以前只处理一个或一对特定模态输入的专家模型不同，MMPedestron 能够处理多个模态输入及其动态组合。

TCC-Det：弱监督 3D 检测的临时一致线索

准确的激光雷达点云目标检测是健壮、安全的自主驾驶和机器人应用的关键前提。当前训练 3D 对象检测器涉及手动注释大量训练数据的需要，这非常耗时且昂贵。因此，容易获得的带注释的训练数据量是有限的，而且这些带注释的数据集可能不包含边缘情况或其他罕见的实例，这仅仅是因为它们出现在如此小的数据集中的概率很低。在本文中，我们提出了一种不需要任何人工标注的方法，通过利用现有的视觉组件和我们周围世界的一致性来训练 3D 对象检测器。因此，该方法可以用于通过仅收集真实世界中的传感器记录来训练 3D 探测器，这是非常便宜的，并且允
许使用比传统的完全监督方法多一个数量级的数据进行训练。

CARB-Net：用于安全自动驾驶的摄像机辅助雷达网络

确保易受伤害的道路使用者的可靠感知对安全自动驾驶至关重要。雷达因其对恶劣天气的适应能力、成本效益、深度传感能力以及在自适应巡航控制中的既定作用而脱颖而出，成为一种有吸引力的传感器选择。然而，雷达有限的角度分辨率给目标识别带来了挑战，特别是在区分近距离目标方面。为了解决这一局限性，我们提出了基于相机的雷达网络(CARB-Net)，这是一种新颖而高效的框架，它融合了相机的角度精度与雷达的稳健性和深度感知能力。

基于百分比的对象检测的生成模型的弱到强合成学习

视觉-语言(VL)模型通过利用来自网络的弱监督图像-文本对，在各种目标检测任务中被证明是非常有效的。然而，这些模型对可视对象的复杂组成(例如，属性、形状及其关系)表现出有限的理解，在给定复杂和多样化的语言查询的情况下导致显著的性能下降。虽然传统的方法试图通过使用文本域上的硬否定合成增强来增强VL 模型，但如果没有密集的图像-文本增强，其有效性仍然受到限制。本文提出了一种结构化合成数据生成方法来提高基于语言的目标检测的 VL 模型的成分理解能力，该方法在图像和