自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(76)
  • 收藏
  • 关注

原创 Spring框架介绍及使用

Spring框架—控制反转(IOC)1 Spring框架概述1.1 什么是Spring1.2 Spring的优点1.3 Spring的体系结构2 入门案例:(IoC)2.1导入jar包2.2目标类2.3 配置文件2.4测试3 入门案例:DI3.1 目标类3.2 dao3.3 service3.4 配置文件3.5 测试4 依赖注入...

2018-03-17 10:49:54 388921 66

原创 【Deep Unsupervised Learning using Nonequilibrium Thermodynamics】扩散模型开山之作

机器学习中的一个核心问题涉及使用高度灵活的概率分布家族来建模复杂的数据集,其中学习、采样、推理和评估仍然是解析或计算上可行的。在这里,我们开发了一种同时实现灵活性和可处理性的方法。这个基本的想法,受到非平衡统计物理的启发,是通过一个迭代的前向扩散过程系统地并缓慢地破坏数据分布中的结构。然后,我们学习一个反向扩散过程,恢复数据中的结构,从而产生一个高度灵活且可处理的数据的生成模型。这种方法使我们能够快速地学习、从深度生成模型中采样和评估概率,这些模型有数千层或时间步,以及在学习的模型下计算条件和后验概率。

2024-05-20 16:15:49 683

原创 Unsupervised Out-of-Distribution Detection with Diffusion Inpainting

无监督的异常分布检测(OOD)旨在通过仅从未标记的域内数据中学习来识别域外数据。我们提出了一种用于此任务的新方法——提升、映射、检测(LMD),该方法利用了扩散模型的最新进展。扩散模型是一类生成模型。其核心在于学习一种迭代的去噪过程,逐渐将噪声图像映射到其训练流形上。LMD 利用这一直觉来进行 OOD 检测。具体而言,LMD 通过扰乱图像将其从原始流形上提升出来,然后使用扩散模型将其映射到域内流形上。对于域外图像,映射后的图像会与其原始流形有较大的距离,LMD 会相应地将其识别为 OOD。

2024-05-16 14:22:24 636

原创 Out-of-Distribution Detection with Semantic Mismatch under Masking

本文提出了一种名为MoodCat的新型分布之外(OOD)检测框架,用于图像分类器。MoodCat会对输入图像的随机部分进行遮盖,并使用生成模型根据分类结果将遮盖的图像合成为新的图像。然后,它计算原始图像和合成图像之间的语义差异以进行OOD检测。与现有的解决方案相比,MoodCat通过提出的遮盖和条件合成策略自然地学习了分布内数据的语义信息,这对于识别OOD至关重要。实验结果表明,MoodCat在OOD检测解决方案中的表现优于最先进的技术,优势明显。

2024-05-08 17:15:08 1049

原创 Denoising diffusion models for out-of-distribution detection

对于机器学习系统的安全部署,检测分布之外的数据(Out-of-distribution detection)至关重要。目前,无监督的分布之外的数据检测主要由生成模型的方法主导,这些方法利用生成模型的似然估计或其他测量值。基于重构的方法提供了一种替代方法,其中使用重构误差的度量来确定样本是否为分布之外的数据。然而,基于重构的方法不太受欢迎,因为它们需要仔细调整模型的信息瓶颈(如潜在维度的大小)以产生良好的结果。

2024-05-08 15:28:23 301

原创 Rethinking Reconstruction Autoencoder-Based Out-of-Distribution Detection

在某些场景中,分类器需要检测远离其训练数据的分布外样本。具有理想的特性,基于重构自动编码器的方法通过使用输入重构误差作为新颖性与正常性的度量来解决这个问题。我们将这种方法的本质形式化为四元域转换,其内在偏见只查询条件数据不确定性的代理。因此,改进的方向被形式化为最大限度地压缩自动编码器的潜在空间,同时确保其作为描述的域转换器的重构能力。

2024-04-29 16:44:58 388

原创 Out-of-Distribution Detection with Reconstruction Error and Typicality-based Penalty

对于实现现实应用的安全可靠运行,进行分布之外(OOD)的检测任务至关重要。在高维度下基于似然性的检测失败被展示出来后,基于典型集的方法引起了人们的关注;然而,它们仍未达到令人满意的性能。我们首先提出了典型性方法的失败案例,然后提出了一种新的基于重构误差的方法,该方法采用了归一化流(NF)。我们进一步引入了基于典型性的惩罚,并将其纳入NF的重构误差中,我们提出了一种新的OOD检测方法,即惩罚重构误差(PRE)。由于PRE检测了偏离输入分布流形的测试输入,因此它有效地检测了对抗性示例以及OOD示例。

2024-04-26 14:25:03 610

原创 Detecting the open-world objects with the help of the “Brain”

Open World Object Detection (OWOD)是一项新颖的计算机视觉任务,具有相当大的挑战,它弥合了经典目标检测(OD)基准和真实世界目标检测之间的差距。除了检测和分类已知的对象之外,OWOD算法还应该能够检测未知的对象,并逐步学习它们。人类在环境中识别未知对象的自然本能主要依赖于他们大脑的知识库。模型仅通过学习几个小数据集的注释就能做到这一点是很困难的。大型预训练的基于语言和图像的模型——VL(即GLIP)对于开放世界具有丰富的知识,但受限于文本提示。

2024-03-27 13:40:01 906

原创 Proposal-Level Unsupervised Domain Adaptation for Open World Unbiased Detector

开放世界目标检测(OWOD)将开放集目标检测与增量学习能力相结合,以应对开放和动态的视觉世界的挑战。现有的工作假设,一个在已知类别上训练的前景预测器可以通过选择前 k 个最自信的前景预测直接转移到识别未知类别位置。然而,在实践中,这一假设很难成立。这是因为预测器不可避免地偏向于已知类别,并且在未知类别外观变化时失效。在这项工作中,我们旨在通过重新构建任务,在无监督域自适应的框架下构建一个无偏的前景预测器,其中当前的有偏预测器有助于形成域:已知对象位置和自信背景位置作为源域,其余的模糊位置作为目标域。

2024-03-26 16:10:07 741

原创 Semi-supervised Open-World Object Detection

传统的开放世界对象检测(OWOD)问题设置首先区分已知和未知类别,然后在后续任务中引入标签时逐步学习未知对象。然而,当前的OWOD公式在增量学习阶段严重依赖外部人类预言者进行知识输入。这种对运行时的依赖使得这种公式在现实世界的部署中显得不太现实。为了解决这个问题,我们引入了一个更现实的公式,名为半监督开放世界检测(SS-OWOD),通过将OWOD的增量学习阶段投射为半监督方式,减少了注释成本。我们证明了最先进的OWOD检测器在提出的SS-OWOD设置中的性能显著下降。

2024-03-21 17:15:34 827

原创 USD: Unknown Sensitive Detector Empowered by Decoupled Objectness and Segment Anything Model

开放世界目标检测(OWOD)是一项新颖而具有挑战性的计算机视觉任务,可以实现对未知目标的检测。现有方法通常通过额外的目标性分支来估计目标的可能性,但忽略了在语义空间和训练目标上互相对立的目标性和分类边界的冲突。为了解决这个问题,我们提出了一种简单而有效的学习策略,即解耦目标性学习(DOL),它将这两个边界的学习分为合适的解码器层。此外,全面检测未知对象需要大量的注释,但标记所有未知对象既困难又昂贵。因此,我们建议利用最近的大视觉模型(LVM),特别是分割任意模型(SAM),来增强对未知对象的检测。

2024-03-20 16:40:29 626

原创 Open World Object Detection in the Era of Foundation Models

物体检测对于众多实际应用至关重要,从机器人技术到医学图像分析。为了在这些应用中可靠地使用,模型必须能够处理意外的或新颖的物体。开放世界物体检测(OWD)范式通过使模型能够检测未知物体并逐步学习已发现的物体,来解决这一挑战。然而,由于严格的基准和任务定义,OWD方法的开发受到了阻碍。这些定义有效地禁止了基础模型。在这里,我们的目标是放宽这些定义,并研究在OWD中使用预训练的基础模型。首先,我们发现现有的基准测试对于评估使用基础模型的方法是不足够的,因为即使是最简单的集成方法也几乎可以饱和这些基准测试。

2024-03-20 16:40:07 1100

原创 End-to-End Object Detection with Transformers(DETR论文解析)

我们提出了一种将目标检测视为直接集合预测问题的新方法。我们的方法简化了检测流程,有效地消除了许多手工设计的组件,如非极大值抑制程序或锚点生成,这些组件通常明确地编码了我们对任务的先验知识。新框架 DETR(DEtection TRansformer)的主要组成部分是一种基于集合的全局损失,通过二分图匹配强制进行唯一预测,以及一种 Transformer 编码器-解码器架构。在给定一组学到的固定小目标查询的情况下,DETR通过推理对象之间的关系和全局图像上下文直接并行输出最终的预测。

2023-12-23 11:26:56 962

原创 PROB: Probabilistic Objectness for Open World Object Detection(论文解析)

Open World Object Detection (OWOD)是一项新的具有挑战性的计算机视觉任务,弥合了传统目标检测(OD)基准和实际世界目标检测之间的差距。除了检测和分类已知/标记的对象外,OWOD算法还应该检测新颖/未知的对象——这些对象可以进行分类并进行增量学习。在标准OD中,与已标记对象不重叠的对象提议会被自动分类为背景。因此,简单地将OD方法应用于OWOD会失败,因为未知对象将被预测为背景。检测未知对象的挑战源于在区分未知对象和背景对象提议方面缺乏监督。

2023-11-17 14:44:58 318

原创 CAT: LoCalization and IdentificAtion Cascade Detection Transformer for Open-World Object Detection

面向开放世界目标检测(OWOD)作为一个更一般且具有挑战性的目标,要求从已知对象的数据中训练的模型能够检测已知和未知的对象,并逐渐学会识别这些未知对象。现有的采用标准检测框架和固定伪标注机制(PLM)的工作存在以下问题:(i)检测未知对象实质上减少了模型检测已知对象的能力。(ii)PLM未充分利用输入的先验知识。(iii)PLM的固定选择方式不能保证模型在正确方向上进行训练。我们观察到,人类在下意识中更倾向于专注于所有前景对象,然后逐一详细识别每个对象,而不是同时定位和识别单个对象,以减轻混淆。

2023-11-10 14:10:18 214

原创 READ: Aggregating Reconstruction Error into Out-of-Distribution Detection(论文解析)

检测非分布(OOD)样本对于在真实世界中安全应用分类器至关重要。然而,已知深度神经网络对于异常数据存在过度自信的问题。现有方法直接通过挖掘分类器在分布内(ID)和OOD之间的不一致性来设计得分函数。在本文中,我们利用重构误差进一步补充了这种不一致性,基于以下假设:在ID数据上训练的自编码器无法像在ID数据上一样重建OOD数据。我们提出了一种新颖的方法,READ(重建误差聚合检测器),来统一分类器和自编码器的不一致性。具体而言,原始像素的重建误差被转化为分类器的潜在空间。

2023-11-09 14:29:17 114

原创 Distilling the Knowledge in a Neural Network【论文解析】

提高几乎任何机器学习算法性能的一种非常简单的方法是在相同的数据上训练许多不同的模型,然后对它们的预测进行平均处理[3]。不幸的是,使用整个模型集合进行预测既繁琐又可能过于计算密集,特别是如果单独的模型是庞大的神经网络,这将使其无法部署到大量用户那里。Caruana及其合作者[1]已经表明,可以将集合中的知识压缩成一个单一模型,这个单一模型更容易部署,而我们使用不同的压缩技术进一步发展了这种方法。

2023-11-02 18:54:04 139

原创 Incremental Object Detection via Meta-Learning【论文解析】

摘要:在真实世界的情境中,目标检测器可能会不断遇到来自新类别的物体实例。当现有的目标检测器应用于这种情景时,它们对旧类别的性能会显著下降。已经有一些努力来解决这个限制,它们都应用了知识蒸馏的变体来避免灾难性遗忘。然而,我们注意到,尽管蒸馏有助于保留以前的学习,但它阻碍了对新任务的快速适应性,这是增量学习的关键要求。因此,我们提出了一种元学习方法,该方法学习重塑模型梯度,以便跨增量任务的信息得到最佳共享。这通过元学习梯度预调节来实现无缝信息传递,从而最小化遗忘并最大化知识传递。

2023-11-01 15:28:59 881

原创 Grounding DINO: Marrying DINO with Grounded Pre-Training for Open-Set Object Detection(论文解析)

这篇论文介绍了一种名为"Grounding DINO"的开放域目标检测器,通过将基于Transformer的检测器DINO与Grounding预训练技术相结合,可以检测具有人类输入(如类别名称或指代表达式)的任意对象。这篇论文的关键解决方案是引入语言到封闭集检测器中,以进行开放集概念的泛化。为了有效融合语言和视觉模态,论文将封闭集检测器概念上划分为三个阶段,并提出了一种紧密融合的解决方案,其中包括特征增强器、语言引导的查询选择和跨模态解码器用于跨模态融合。

2023-10-31 16:19:45 238

原创 Detecting Everything in the Open World: Towards Universal Object Detection(论文解析)

在本文中,我们正式探讨了通用目标检测,旨在检测每个场景并预测每个类别。依赖于人工注释、有限的视觉信息以及开放世界中的新颖类别严重限制了传统检测器的通用性。我们提出了UniDetector,这是一个通用目标检测器,具有在开放世界中识别大量类别的能力。1) 通过对齐图像和文本空间,它利用多个来源和异构标签空间的图像进行训练,确保了通用表示的充分信息。2) 它很容易推广到开放世界,同时保持了已知和未知类别之间的平衡,这得益于视觉和语言模态的丰富信息。

2023-10-27 11:07:44 138

原创 Learning Open-World Object Proposals without Learning to Classify(论文解析)

物体提议已经成为许多视觉流程的重要预处理步骤,包括目标检测、弱监督检测、目标发现、跟踪等。与无需学习的方法相比,基于学习的提议最近变得越来越受欢迎,这主要是因为对目标检测的兴趣日益增长。常见的范式是从带有一组对象区域及其对应类别的标记数据中学习对象提议。然而,这种方法通常难以处理在训练集中不存在的开放世界中的新对象。在本文中,我们发现问题在于现有提议方法中的二元分类器往往对训练类别过拟合。

2023-10-23 17:07:10 563

原创 Segment Anything(论文解析)

我们介绍了“Segment Anything” (SA) 项目:这是一个新的任务、模型和数据集对于图像分割。使用我们高效的模型进行数据收集,我们构建了迄今为止最大的分割数据集(远远超过其他数据集),其中包含了超过10亿个掩膜,覆盖了1100万张经过许可和尊重隐私的图像。该模型被设计和训练为可提示的,因此可以实现零次学习,适用于新的图像分布和任务。我们在多个任务上评估了它的性能,并发现它的零次学习性能令人印象深刻,通常可以与先前的完全监督结果相竞争甚至更优越。

2023-10-17 10:24:06 219

原创 FreeSOLO: Learning to Segment Objects without Annotations*(论文解析)

实例分割是一项基本的计算机视觉任务,旨在识别并分割图像中的每个对象。然而,要学习实例分割通常需要昂贵的注释,例如边界框和分割掩模。在这项工作中,我们提出了一种完全无监督的学习方法,可以学习不受类别限制的实例分割,而无需任何注释。我们介绍了FreeSOLO,这是建立在简单实例分割方法SOLO之上的自监督实例分割框架。我们的方法还提出了一种新颖的面向定位的预训练框架,在其中可以以无监督的方式从复杂场景中发现对象。

2023-10-13 15:31:56 249

原创 PROB: Probabilistic Objectness for Open World Object Detection(论文解析)

开放世界目标检测(OWOD)是一个新的、具有挑战性的计算机视觉任务,它弥合了传统的目标检测(OD)基准和现实世界中的目标检测之间的差距。除了检测和分类已知/标记的对象外,OWOD算法还应该能够检测新颖/未知的对象,这些对象可以进行分类和增量学习。在标准的OD中,不与已标记对象重叠的对象提议会自动分类为背景。因此,简单地将OD方法应用于OWOD会失败,因为未知对象将被预测为背景。检测未知对象的挑战源于在区分未知对象和背景对象提议方面缺乏监督。

2023-09-16 10:55:32 478

原创 Annealing-based Label-Transfer Learning for Open World Object Detection(论文解析)

开放世界目标检测(Open World Object Detection,OWOD)因其在现实世界中的实用性而引起了广泛关注。以往的OWOD研究通常采用手动设计未知发现策略来从背景中选择未知提议,但由于缺乏适当的先验知识,存在不确定性。在本文中,我们提出目标检测可以被看作是一个目标级特征纠缠过程,其中未知特征通过卷积操作传播到已知提议,可以被提炼以增强未知目标的识别,而无需手动选择。因此,我们提出了一种简单而有效的基于退火的标签传递框架,充分探索已知提议以减轻不确定性。

2023-09-16 09:58:00 226

原创 DEFORMABLE DETR: DEFORMABLE TRANSFORMERS FOR END-TO-END OBJECT DETECTION (论文解析)

DETR最近被提出,旨在消除目标检测中许多手工设计组件的需要,同时表现出良好的性能。然而,它在收敛速度较慢和特征空间分辨率有限方面存在问题,这是由于Transformer注意模块在处理图像特征图时的局限性。为了减轻这些问题,我们提出了Deformable DETR,其注意模块仅关注围绕参考点的一小组关键采样点。Deformable DETR可以在比DETR少10倍的训练时期内实现更好的性能(特别是在小目标上)。对COCO基准的大量实验证明了我们方法的有效性。

2023-09-09 20:03:33 537 2

原创 End-to-End Object Detection with Transformers(论文解析)

我们提出了一种将目标检测视为直接集合预测问题的新方法。我们的方法简化了检测流程,有效地消除了许多手工设计的组件的需求,如显式编码我们关于任务的先验知识的非极大值抑制过程或锚点生成。新框架的主要要素,称为DEtection TRansformer或DETR,包括一个基于集合的全局损失,通过二分图匹配强制执行唯一的预测,以及一个Transformer编码器-解码器架构。给定一组固定的学习目标查询,DETR通过推理对象之间的关系和全局图像上下文,直接并行输出最终的预测。

2023-09-08 20:03:19 742

原创 Towards Open World Object Detection【论文解析】

人类在环境中有一种自然本能,即识别未知的物体实例。对于这些未知实例的内在好奇心有助于在相应的知识最终可得到时学习它们。无需明确监督就识别尚未引入为“未知”的物体。当相应标签逐步接收时,逐步学习这些已识别的未知类别,而不会遗忘先前学习的类别。我们对问题进行了规定,引入了强大的评估协议,并提供了一种新颖的解决方案,称为ORE:开放世界目标检测器,它基于对比聚类和基于能量的未知识别。我们的实验评估和消融研究分析了ORE在实现开放世界目标方面的效力。

2023-08-09 11:11:58 904 1

原创 CLIP-GCD: Simple Language Guided Generalized Category Discovery(论文翻译)

通用类别发现(Generalized Category Discovery,GCD)需要模型既能对已知类别进行分类,又能对未标记数据中的未知类别进行聚类。之前的方法利用自监督预训练与标记数据的监督微调相结合,然后采用简单的聚类方法。在本文中,我们认为这种方法在处理未知类别的情况下仍然容易出现性能不佳,并且没有充分利用一个关键因素:对象类别之间的语义关系。因此,我们提出了两种互补的多模态(视觉和语言)模型的利用方式。首先,我们通过用CLIP替换单模态特征来建立一个强基线,CLIP受其零样本性能启发。

2023-07-31 16:28:42 385

原创 OPEN-WORLD SEMI-SUPERVISED LEARNING(论文翻译)

在现实世界的场景中,半监督学习应用的一个基本限制是假设未标记的测试数据仅包含在已标记的训练数据中先前遇到的类别。然而,在真实场景中,这种假设很少成立,因为在测试时可能会出现属于新类别的实例。因此,我们引入了一种新颖的开放世界半监督学习设置,明确了未标记的测试数据中可能出现新类别的概念。在这种新颖的设置下,目标是解决标记和未标记数据之间的类别分布不匹配,其中在测试时每个输入实例要么需要被分类到现有类别之一,要么需要被初始化为一个新的未知类别。为了解决这个具有挑战性的问题,

2023-07-21 08:19:10 270

原创 A Simple Framework for Contrastive Learning of Visual Representations(论文翻译)

本文提出了SimCLR(Simple Framework for Contrastive Learning of Visual Representations):一种用于对视觉表示进行对比学习的简单框架。我们简化了最近提出的对比自监督学习算法,不需要专门的架构或存储库。为了理解对比预测任务如何学习有用的表示,我们系统地研究了我们框架的主要组成部分。

2023-07-13 17:31:58 674

原创 Generalized Category Discovery(论文翻译)

在本文中,我们考虑了一个非常通用的图像识别场景,其中给定了一个带标签和无标签的图像集,任务是对所有无标签集中的图像进行分类。在这里,无标签图像可能来自带标签的类别,也可能来自新类别。现有的识别方法无法处理这种情况,因为它们做出了一些限制性的假设,比如无标签实例只来自已知的或未知的类别,并且未知类别的数量是先验已知的。我们处理更加不受约束的设置,将其称为“广义类别发现”,并挑战了所有这些假设。我们首先通过采用最新类别发现的最先进算法,并针对这个任务进行了调整,建立了强大的基准线。

2023-07-05 17:11:15 913 3

原创 Open-world Semi-supervised Novel Class Discovery(论文翻译)

传统的半监督学习任务假设标记和未标记数据遵循相同的类分布,但现实的开放世界场景更复杂,未知的新类混合在未标记集中。因此,它是一个巨大的挑战,不仅要识别样本从已知的类,但也发现未知数量的新的类中的未标记的数据。在本文中,我们介绍了一种新的开放世界的半监督新类发现方法命名为OpenNCD,一个基于多个原型的渐进的双层对比学习方法。所提出的方法是由两个相互增强的部分。首先,介绍了一种双层对比学习方法,该方法保持了原型和原型组级别的成对相似性,以实现更好的表示学习。

2023-07-05 14:14:29 706

原创 Grounded Language-Image Pre-training(论文翻译)

本文提出了一个基于的语言-图像预训练(GLIP)模型学习对象级,语言感知,语义丰富的视觉表示。GLIP将目标检测和phrase grounding统一起来进行预训练。统一带来两个好处:1)它允许GLIP从检测和grounding data两者学习以改进这两个任务并引导良好的grounding模型;2)GLIP可以利用大量的图像-文本对通过自训练的方式生成grounding边界框,使得学习到的表示语义更加丰富。

2023-06-03 11:12:29 769

原创 OW-DETR: Open-world Detection Transformer(论文解析)

开放世界对象检测(OWOD)是一个具有挑战性的计算机视觉问题,其中的任务是检测一组已知的对象类别,同时识别未知对象。此外,模型必须逐步学习在下一个训练片段中变得已知的新类。与标准目标检测不同,OWOD设置对在潜在未知对象上生成高质量候选框、将未知对象与背景分离以及检测各种未知对象提出了重大挑战。在这里,我们介绍了一种新的端到端的基于transformer的框架,OW-DETR,为于开放世界的目标检测。OW-DETR包括三个专用组件,即,注意力驱动的伪标签,新类分类和对象评分,以明确地解决上述OWOD的挑战。

2023-05-31 19:09:47 1627 1

原创 UC-OWOD: Unknown-Classified Open World Object Detection(论文翻译)

开放世界对象检测(OWOD)是一个具有挑战性的计算机视觉问题,需要检测未知对象并逐渐学习所识别的未知类。但是,它不能将未知实例区分为多个未知类。在这项工作中,我们提出了一种新的OWOD问题,称为未知分类的开放世界对象检测(UC-OWOD)。UC-OWOD的目标是检测未知的实例,并将它们分类到不同的未知类。此外,我们定义这个问题,并设计了一个两阶段的对象检测器来解决UC-OWOD。首先,未知标签感知建议框proposal和未知判别分类头用于检测已知和未知对象。

2023-05-23 20:25:09 796

原创 Towards Open-Set Object Detection and Discovery(论文翻译)

随着人类对知识的不断追求,开集目标检测(OSOD)被设计用于识别动态世界中的未知目标。然而,当前设置的一个问题是,所有预测的未知对象共享相同的类别为“未知”,这需要通过人在环方法的增量学习来标记新的类别。为了解决这个问题,我们提出了一个新的任务,即开放集对象检测和发现(OSODD)。这项新任务旨在扩展开集对象检测器的能力,以进一步发现基于视觉外观的未知对象的类别,而无需人工努力。我们提出了一个两阶段的方法,首先使用一个开放集对象检测器来预测已知和未知的对象。

2023-05-16 09:04:41 669

原创 Towards Open World Object Detection(OWOD)代码复现

python -m pip install -e ./python tools/train_net.py --num-gpus 1 --config-file ./configs/OWOD/t1/t1_train.yaml SOLVER.IMS_PER_BATCH 8 SOLVER.BASE_LR 0.0025 OUTPUT_DIR “./output/t1”No module named ‘reliability’解决办法:pip install reliabilityNo module named

2023-05-11 21:53:31 697

原创 不断联的从Google Drive下载超大文件

以我为例,这里我要下载一个22G的压缩包,右键下载后一个晚上完成了90%就停了,点击暂停继续下载也仍是一点反应没有。在原网页获取新的链接也一直被提示下载额不够,无法下载。推荐使用Google Chrome浏览器,在IDM安装完成后会自动跳转到浏览器安装扩展,直接允许就好,我用的是Microsoft Edge,效果一样。以上工作完后右键继续下载就可以看到连接成功,继续往下下载啦!右键下载后会自动启动IDM设置好保存位置等就可以开始下载。在自己的网盘内右键快捷地址下载获取新的文件地址并复制。

2023-05-08 21:39:19 862

原创 detectron2-训练coco数据集

根据自己的目录来设置。

2023-05-06 21:37:52 343

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除