Towards Universal Object Detection by Domain Attention解读

论文地址
代码

概述

 论文提出了一个通用的目标检测系统,适应于不同的领域,而且不需要任何的先验知识。该模型基于SENet,将多个SENet得到的特征图连接在一起,并且提出了domain attention,将其施加在连接好的特征图后,这样能够使模型更好地适应不同场景下的目标检测任务。
本文的主要工作如下:

  • 建立了一个新的benckmark,包括11个不同的目标检测的数据集。
  • 提出了一系列系统结构用于universal/Multi-domain Object Detection。
介绍

 目标检测任务是多种多样的,有种类差异(人脸、马、医学损伤等等),也有相机视角差异(从飞机、自动驾驶汽车上拍摄的图像等),还有图像风格(比如漫画、剪贴画、水彩画、医学图像等)等。现有的检测器大多是针对某一明确领域的(在单一数据集上进行训练和测试),部分原因是目标检测数据集是多样的且它们之间存在非平凡的领域转换。
 众所周知,为不同领域的任务各自设置专门的检测器能达到很好的检测效果。但是实际应用中,系统可能需要处理多个领域的图像。简单粗暴一点的方法,我们要处理D个领域的图像,那么就训练D个检测器分别处理每个领域。但是,系统不一定明确某个时间点出现的是哪个领域的图像,而且模型会很大。所以研究人员提出了两种方案(图像分类),一种是在一个通用模型上解决多任务,另一种是在多个领域解决同一任务。目标检测比分类任务复杂得多。
新的benckmark(包括11个不同的目标检测数据集),如Figure 1所示:
在这里插入图片描述

一系列的系统结构用于universal/Multi-domain Object Detection如Figure 2所示:
在这里插入图片描述
其中D表示不同的domain,O表示输出,A表示domain-specific的adapter,DA表示文中提出的领domain-attentive module,蓝色部分是universal domain,其他颜色表示各领域专用。Figure 2的(a)和(b)是多领域检测器,显然它们都需要领域的先验知识。(a)是一系列领域专用检测器,不共享参数和计算;在(a)的基础上进行卷积层共享以及实现轻量级的领域专用的适应层,即(b)。图2的(c)和(d)是通用检测器,(c)所有领域

  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值