基于知识蒸馏的YOLOv3算法研究

最新推荐文章于 2024-04-15 15:16:32 发布

HoraceO

最新推荐文章于 2024-04-15 15:16:32 发布

阅读量540

点赞数

分类专栏：文献文章标签：人工智能

本文链接：https://blog.csdn.net/weixin_50094312/article/details/127628304

版权

文献专栏收录该内容

13 篇文章 2 订阅

订阅专栏

基于知识蒸馏的YOLOv3算法研究

期刊：计算机工程与应用 C

时间：2022

研究院：重庆大学研究生

关键词：知识蒸馏；模型压缩；目标检测；YOLOv3

思想来源

当前目标检测中主要基于特征提取层进行知识蒸馏，该类方法存在两个问题，

第一，没有对教师网络传递知识的重要程度进行度量，

第二，仅对特征提取层进行蒸馏，教师网络的知识未充分传递给学生网络。

针对第一个问题，通过引入信息图作为蒸馏的监督信号，强化了学生网络对教师网络重点知识的学习；

针对第二个问题，对特征提取层和特征融合层的输出同时进行蒸馏，使学生网络更充分地学习教师网络传递的知识

本文的贡献点如下：（1）将信息图作为监督信号对学生网络展开蒸馏。信息图是教师网络传递的知识重要性的分布图，不仅过滤掉了教师网络传递的背景信息，且强化了学生网络对教师网络重点知识的学习。

（2）在特征提取层和特征融合层上同时展开蒸馏。在特征提取层上蒸馏后，特征融合层上的蒸馏对前者的蒸馏有一个校正作用，可以进一步提升蒸馏效果

知识蒸馏算法改进

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-qkXiPPqE-1667267765640)(基于知识蒸馏的 YOLOv3 算法研究.assets/image-20221101095510650.png)]

基于信息图的蒸馏

基于信息图的蒸馏过程分为 3 个步骤：（1）如图 5 所示，将学生网络输出的特征层输入一个由 1×1 卷积组成的自适应层，使学生网络输出特征层的维度和教师网络保持一致；（2）在信息图的指导下计算特征层之间的平方差损失，信息图对涵盖目标的区域均赋予了权重，非目标区域的值为 0；（3）进行反向传播，只更新学生网络的权重。经过模型多次训练，学生网络的输出将越来越接近教师网络的输出。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-3qzz22hs-1667267765641)(基于知识蒸馏的 YOLOv3 算法研究.assets/image-20221101095527959.png)]

息图的生成如图 6 所示，首先由教师网络的预测框和真实标签获得 mask-map，mask-map 中包含圆圈的部分值为 1，表示前景区域，未包含圆圈的部分值为 0，表示背景区域。在教师网络传递的前景信息中，越靠近目标的关键部分，最终对目标的判断越具有决定性影响，但 mask-map 中只有 0 值和 1 值，无法对不同前景信息的重要性进行区分。教师网络输出的置信度包含了前景信息的重要程度，越靠近目标核心部分的置信度越大，越远离的置信度越小。本文基于教师网络输出的置信度，对现有的 mask-map 进行改进，提出了可以在蒸馏过程中提供监督信号的信息图，信息图的计算方式如式（5）所示：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-AYgo6xl9-1667267765641)(基于知识蒸馏的 YOLOv3 算法研究.assets/image-20221101095537537.png)]

Information - map = confidenceteacher·mask - map （5）式中，Information - map 表示信息图，confidenceteacher 表示教师网络输出的置信度。将置信度和 mask - map 相乘获得信息图，可以在值为 1 的部分获得有区分度的权重，在计算损失时，权重更大的位置会受到更多关注，加强了学生网络对教师网络传递的重点知识的学习。

特征融合层的蒸馏

在网络结构中，特征提取层负责获得图片的特征信息，并以特征层的形式输出。特征融合层可以将不同尺度的特征层进行拼接或相加，获得来自不同感受野的信息，如图 7 所示。目前的知识蒸馏架构大多只针对特征提取层展开蒸馏，无法获得教师网络在特征融合层的知识。针对这个问题，本文提出同时对特征提取层和特征融合层展开蒸馏，相比于现有的知识蒸馏架构，可以进一步提升蒸馏效果，蒸馏中的损失函数如式（6）所示：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-zxCPy2hP-1667267765642)(基于知识蒸馏的 YOLOv3 算法研究.assets/image-20221101095545713.png)]