ICLR 2021 KNOWLEDGE DISTILLATION

最新推荐文章于 2022-07-27 23:59:40 发布

_liuzt

最新推荐文章于 2022-07-27 23:59:40 发布

阅读量909

点赞数

分类专栏： Object Detection 文章标签：人工智能深度学习计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_39512995/article/details/114324766

版权

Object Detection 专栏收录该内容

11 篇文章 1 订阅

订阅专栏

IMPROVE OBJECT DETECTION WITH FEATURE-BASED KNOWLEDGE DISTILLATION: TOWARDS ACCURATE AND EFFICIENT DETECTORS学习笔记

ICLR2021

Introduction

大多数为图像分类设计的知识蒸馏网络在目标检测任务中效果不好，原因是：
- 前景和背景像素之间不平衡
- 缺乏对不同像素之间关系的提炼
基于以上两个原因，本文分别做了以下工作：
- attention-guided distillation 注意力引导蒸馏：通过注意力机制来发现前景物体的关键像素，从而使学生更加努力地学习其特征。
- non-local distillation非局部蒸馏：使学生不仅能够学习单个像素的特征，而且能够学习由非局部模块捕获的不同像素之间的关系。
本文提出的两个模块只在训练的时候需要，在推理的过程中不会引入额外的计算
本文的方法是基于特征的蒸馏，可以直接用于所有类型的目标检测器
不同于图像分类的知识蒸馏中高AP的教师网络会对学生网络造成负面影响，目标检测中的知识蒸馏需要高AP的教师网络
相当于是基于这篇工作进行改进Distilling object detectors with fine-grained feature imitation

METHODOLOGY

在这里插入图片描述

ATTENTION-GUIDED DISTILLATION

空间注意力 $G^s$ (每一点上C个通道的平均值)：

通道注意力 $G^c$ （每个通道上所有点的平均值）：
空间注意力Mask $M^s$ :
通道注意力Mask $M^c$ :

$M^c=C ·softmax((G^c(A^S) +G^c(A^τ))/T)$

$T$ 是softmax中的超参数，用来调节注意力mask中元素的分布：

在这里插入图片描述

ATTENTION-GUIDED DISTILLATION的损失 $L_{AGD}$ 由两部分组成:attention transfer loss $L_{AT}$ 和attention-masked loss $L_{AM}$

在这里插入图片描述

在这里插入图片描述

NON-LOCAL DISTILLATION

在这里插入图片描述

OVERALL LOSS FUNCTION

在这里插入图片描述

EXPERIMENT

在这里插入图片描述

Ablation study

在这里插入图片描述

Sensitivity study on hyper-parameters

在这里插入图片描述

Sensitivity study on the types of non-local modules

在这里插入图片描述

Discussion

各个方面都有提高

在这里插入图片描述

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
2
评论
ICLR 2021 KNOWLEDGE DISTILLATION

IMPROVE OBJECT DETECTION WITH FEATURE-BASED KNOWLEDGE DISTILLATION: TOWARDS ACCURATE AND EFFICIENT DETECTORS学习笔记ICLR2021Introduction大多数为图像分类设计的知识蒸馏网络在目标检测任务中效果不好，原因是：前景和背景像素之间不平衡缺乏对不同像素之间关系的提炼基于以上两个原因，本文分别做了以下工作：attention-guided distillation
复制链接

扫一扫

专栏目录

_liuzt CSDN认证博客专家 CSDN认证企业博客

码龄7年

31: 原创

11万+: 周排名

207万+: 总排名

4万+: 访问

: 等级

727: 积分

24: 粉丝

47: 获赞

29: 评论

293: 收藏

私信

关注

热门文章

分类专栏

Object Detection 11篇
pytorch 2篇
机器学习 2篇
C# 1篇
经典网络 2篇
Semantic Segmentation 1篇
C++ 5篇
嵌入式 2篇
python 7篇
TX2 1篇
MATLAB 1篇

最新评论

九轴陀螺仪ICM20948磁力计校准
super_20200413: 请问数据是怎么采集的，需要绕8吗
九轴陀螺仪ICM20948磁力计校准
SZ00169: 现在还有用陀螺仪么?可以合作一下
几种常用的滤波算法
IRQHandler: 引用「limit_filter」 limit_filter()这个函数在返回new_value前，应该要更新value的值吧？
九轴陀螺仪ICM20948磁力计校准
山中屋人: x y z 不用分别测试吗
九轴陀螺仪ICM20948磁力计校准
AQI琦: 地磁计校准的流程很清晰，别的要么上来摆一堆分析和公式，要么直接给代码也没注释。半天讲不到点上。找半天看了这个才发现地校准正这么简单。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。