目标检测
文章平均质量分 86
~拾捌~
这个作者很懒,什么都没留下…
展开
-
目标检测评价指标
文章目录评价指标:1、准确率 (Accuracy)2、混淆矩阵 (Confusion Matrix)3、精确率(Precision)与召回率(Recall)4、平均精度(Average-Precision,AP)与 mean Average Precision(mAP)5、IoU6、ROC(Receiver Operating Characteristic)曲线与AUC(Area Under Curve)7、PR曲线和ROC曲线比较8、非极大值抑制(NMS)转载:https://www.cnblogs.c转载 2022-05-27 10:19:57 · 239 阅读 · 0 评论 -
SSD: Single Shot MultiBox Detector 论文翻译
XXXXXXX我们提出了一种利用单一的深度神经网络来检测图像中的目标的方法。我们的方法名为SSD,它将不同的高宽比和比例的边界框的输出空间离散为一组默认框。在预测时,网络为每个默认框中每个对象类别的存在生成分数,并对该框进行调整,以更好地匹配对象形状。此外,该网络结合了来自不同分辨率的多个特征地图的预测,以自然地处理不同大小的对象。相对于需要对象建议的方法,SSD很简单,因为它完全消除了建议生成和后续的像素或特征重采样阶段,并将所有计算封装在单个网络中。这使得SSD易于训练,并可以直接集成到需要一个检测组原创 2022-06-01 17:09:08 · 1819 阅读 · 1 评论 -
Multimodal Object Detection via Probabilistic Ensembling——基于概率集成实现多模态目标检测
ECCV2022 | 多模态融合检测新范式!基于概率集成实现多模态目标检测github代码原创 2023-05-11 09:39:58 · 520 阅读 · 0 评论 -
目标检测论文翻译——Instance Localization for Self-supervised Detection Pretraining(自监督)
先前关于自监督学习的研究已经在图像分类方面取得了相当大的进展,但在目标检测方面的传递性能通常会降低。本文的目的是提出专门用于对象检测的自监督预训练模型。基于分类和检测之间的固有差异,我们提出了一种新的自我监督的借口任务,称为实例定位。图像实例粘贴在不同的位置并缩放到背景图像上。借口任务是预测给定合成图像以及前景边界框的实例类别。我们表明,将边界框集成到预训练中可以促进迁移学习的更好的任务对齐和架构对齐。此外,我们提出了一种增强边界框的方法,以进一步增强特征对齐。翻译 2023-02-24 10:50:07 · 369 阅读 · 0 评论 -
论文翻译——Learning in Audio-visual Context: A Review, Analysis, and New Perspective(视听环境中的学习:回顾、分析和新视角)
视觉和听觉是两种感官,在人类交流和场景理解中起着至关重要的作用。为了模拟人类的感知能力,近年来,视听学习一直是一个蓬勃发展的领域,其目的是开发从音频和视觉模式中学习的计算方法。预计将进行一次全面的调查,以系统地组织和分析视听领域的研究。从视听认知基础的分析开始,我们介绍了启发我们计算研究的几个关键发现。然后,我们系统地回顾了最近的视听学习研究,并将其分为三类:视听促进、跨模态感知和视听协作。通过我们的分析,我们发现,视听数据在语义、空间和时间上的一致性支持了上述研究。翻译 2022-11-24 14:53:12 · 435 阅读 · 0 评论 -
论文翻译——Catch Me If You Hear Me: Audio-Visual Navigation in Complex Unmapped Environments with Moving
视听导航结合视觉和听觉,在未映射的环境中导航到声音发射源。虽然最近的方法已经证明了音频输入对检测和找到目标的好处,但它们专注于干净和静态的声音源,并努力推广到闻所未闻的声音。在这项工作中,我们提出了一种新颖的动态视听导航基准,它需要在嘈杂和分散注意力的环境中捕捉移动的声源,这带来了一系列新的挑战。我们引入了一种强化学习方法,该方法学习针对这些复杂设置的鲁棒导航策略。为了实现这一点,我们提出了一种架构,该架构融合了空间特征空间中的视听信息,以学习局部地图和音频信号中固有的几何信息的相关性。翻译 2022-11-24 11:01:27 · 1601 阅读 · 0 评论 -
论文翻译——Self-Supervised Moving Vehicle Detection From Audio-Visual Cues(基于视听线索的自监督运动车辆检测)
对于任何自主操作的户外机器人或自动驾驶车辆来说,运动车辆的鲁棒检测是一项关键任务。解决这一任务的大多数现代方法依赖于使用大型车辆检测数据集(如nuScenes或Waymo Open数据集)训练基于图像的检测器。提供手动注释是一项昂贵且费力的工作,在实践中无法很好地扩展。为了解决这个问题,我们提出了一种自我监督的方法,该方法利用视听线索来检测视频中的移动车辆。我们的方法使用对比学习从对应的图像对和记录的音频中定位图像中的车辆。翻译 2022-11-24 09:58:31 · 191 阅读 · 0 评论