#今日论文推荐# ICLR 2022 | 达摩院灵瞳实验室：目标检测网络结构新范式——GiraffeDet

最新推荐文章于 2024-06-23 00:13:45 发布

wwwsxn

最新推荐文章于 2024-06-23 00:13:45 发布

阅读量302

点赞数

分类专栏： AI 文章标签：深度学习计算机视觉人工智能

原文链接：https://www.aminer.cn/research_report/6310b36c7cb68b460f117aa5

版权

AI 专栏收录该内容

27 篇文章 0 订阅

订阅专栏

#今日论文推荐# ICLR 2022 | 达摩院灵瞳实验室：目标检测网络结构新范式——GiraffeDet

本文解读我们 ICLR 2022 上发表的论文《GiraffeDet: A Heavy-Neck Paradigm for Object Detection》。我们提出了一个新的目标检测网络结构范式：GiraffeDet，它具有极轻量级计算量的 backbone 和大计算量的 neck，使得网络更关注于高分辨率特征图中空间信息和低分辨率特征图中语义信息的信息交互。同时这个设计范式允许检测网络在网络早期阶段就以相同优先级处理高层语义信息和低层空间信息，使其在检测任务上更加有效。
大量实验表明，在相同 head 及同量级 Flops 下，GiraffeDet 能够取得比之前 SOTA 模型更优的结果。

目标检测任务面临的主要挑战在于尺度差异（Scale Variance）。图 1 给出了 ImageNet 和 COCO 数据集中的前景目标在 scale 的分布，横轴（Relative Scale）为前景目标尺度相对于图片尺度的相对 scale，竖轴（CDF）为当前 scale 下的前景目标数量占整个数据集中所有前景目标数量的百分比。可以看到：
1. COCO 数据集中的前景目标 scale 跨度大：10% 的小前景目标的 scale（0.024）和 10% 的大前景目标的 scale（0.472）相差足足 20 倍；
2. COCO 数据集和 ImageNet 数据集的前景目标 scale 分布存在偏移：COCO 数据集中小目标占比更大，有一半的目标的 relative scale<0.106；相比之下 ImageNet 数据集中前景目标 scale 分布比较均匀，一半的前景目标的 relative scale<0.556；
基于以上观察，在论文中，我们提出了两个问题：
1. 如何解决 scale variance 的挑战，获得针对目标检测任务有效的多尺度的表征（multi-scale representation）；
2. 目标检测网络的 backbone 基本都为 scale-decreased 的模型，使用 ImageNet 数据集进行 Pretrain，这类设计的 backbone 是否在目标检测任务上不可或缺。
针对上述问题，我们在文章中提出了创新性的轻计算量 backbone 重计算量 neck 的 GiraffeDet 模型。

论文题目：GiraffeDet: A Heavy-Neck Paradigm for Object Detection
详细解读：https://www.aminer.cn/research_report/6310b36c7cb68b460f117aa5https://www.aminer.cn/research_report/6310b36c7cb68b460f117aa5
AMiner链接：https://www.aminer.cn/?f=cs