Towards Universal Object Detection by Domain Attention解读

最新推荐文章于 2024-05-08 09:35:07 发布

WangKingJ

最新推荐文章于 2024-05-08 09:35:07 发布

阅读量927

点赞数 1

分类专栏：计算机视觉

本文链接：https://blog.csdn.net/WangKingJ/article/details/102996432

版权

论文地址
 代码

概述

论文提出了一个通用的目标检测系统，适应于不同的领域，而且不需要任何的先验知识。该模型基于SENet，将多个SENet得到的特征图连接在一起，并且提出了domain attention，将其施加在连接好的特征图后，这样能够使模型更好地适应不同场景下的目标检测任务。
本文的主要工作如下：

建立了一个新的benckmark,包括11个不同的目标检测的数据集。
提出了一系列系统结构用于universal/Multi-domain Object Detection。

介绍

目标检测任务是多种多样的，有种类差异（人脸、马、医学损伤等等），也有相机视角差异（从飞机、自动驾驶汽车上拍摄的图像等），还有图像风格（比如漫画、剪贴画、水彩画、医学图像等）等。现有的检测器大多是针对某一明确领域的（在单一数据集上进行训练和测试），部分原因是目标检测数据集是多样的且它们之间存在非平凡的领域转换。
众所周知，为不同领域的任务各自设置专门的检测器能达到很好的检测效果。但是实际应用中，系统可能需要处理多个领域的图像。简单粗暴一点的方法，我们要处理D个领域的图像，那么就训练D个检测器分别处理每个领域。但是，系统不一定明确某个时间点出现的是哪个领域的图像，而且模型会很大。所以研究人员提出了两种方案（图像分类），一种是在一个通用模型上解决多任务，另一种是在多个领域解决同一任务。目标检测比分类任务复杂得多。
新的benckmark(包括11个不同的目标检测数据集)，如Figure 1所示：
在这里插入图片描述

一系列的系统结构用于universal/Multi-domain Object Detection如Figure 2所示:
在这里插入图片描述
其中D表示不同的domain，O表示输出，A表示domain-specific的adapter，DA表示文中提出的领domain-attentive module，蓝色部分是universal domain，其他颜色表示各领域专用。Figure 2的（a）和（b）是多领域检测器，显然它们都需要领域的先验知识。（a）是一系列领域专用检测器，不共享参数和计算；在（a）的基础上进行卷积层共享以及实现轻量级的领域专用的适应层，即（b）。图2的（c）和（d）是通用检测器，（c）所有领域

最低0.47元/天解锁文章

WangKingJ

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
2
评论
Towards Universal Object Detection by Domain Attention解读

论文地址代码概述论文提出了一个通用的目标检测系统，适应于不同的领域，而且不需要任何的先验知识。该模型基于SENet，将多个SENet得到的特征图连接在一起，并且提出了domain attention，将其施加在连接好的特征图后，这样能够使模型更好地适应不同场景下的目标检测任务。本文的主要工作如下：建立了一个新的benckmark,包括11个不同的目标检测的数据集。提出了一系列系统结...
复制链接

扫一扫

专栏目录