Towards OpenWorld Recognition

本文提出开放世界识别问题,形式化定义并解决在无限未知类别的场景中,识别系统需持续学习和更新。通过最近非离群值(NNO)算法,平衡开放空间风险和准确性,适用于大规模视觉识别任务。NNO在ImageNet数据集上的实验展示了其在开放世界识别中的优秀性能。
摘要由CSDN通过智能技术生成

Abhijit Bendale, Terrance Boult

University of Colorado at Colorado Spring

0.摘要

随着计算机技术的发展,丰富的分类模型和高计算能力的视觉识别系统得到了广泛的应用。在现实世界中的识别提出了在受控的实验室环境中不明显的多重挑战。数据集是动态的,必须不断地检测并添加新的类别。在预测时,一个训练有素的系统必须处理无数看不见的类别。操作系统需要最少的停机时间,即使是学习。为了处理这些操作问题,我们提出了开放世界识别的问题并对其进行了正式定义。证明了线性变换特征空间中距离单调递减函数的阈值和可以平衡开放空间风险和经验风险(核心)。我们的理论扩展了现有的开放世界识别算法。我们提出了一个评估开放世界识别系统的协议。本文提出了最近非离群值(NNO)算法,该算法能有效地改进模型,在检测离群值和管理开放空间风险的同时不断增加对象类别。(意义)我们在ImageNet数据集上进行了1.2万多幅图像的实验,以验证我们的方法在大规模视觉识别任务中的有效性。NNO始终如一地在开放世界识别中产生优异的结果。

1.引言

在过去的十年中,用于构建和评估视觉识别系统的数据集在大小和变化上都有所增加。数据集的规模从几百张图片增加到数百万张图片,数据集中的类别数量从几十个类别增加到上千个类别。随着数据集的发展,丰富的分类模型的共同进化导致了许多商业应用[10,46,33]。在将识别系统从受控的实验室环境移植到真实世界的过程中,会遇到许多操作上的挑战。开放世界中的识别系统必须不断更新附加的对象类别,对看不见的类别保持鲁棒性,

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值