知识蒸馏（Knowledge Distillation）

DreamZ00

于 2023-03-19 17:36:36 发布

阅读量366

点赞数 1

分类专栏：知识扫盲文章标签：深度学习人工智能计算机视觉图像处理

本文链接：https://blog.csdn.net/DreamZ00/article/details/129653535

版权

2 篇文章 0 订阅

订阅专栏

知识蒸馏

知识蒸馏（Knowledge
Distillation）是一种模型压缩方法，可以将大型深度模型中的知识转移到小型模型中，以期达到更好的性能和精度。知识蒸馏时通过构建一个轻量化的小模型，利用性能更好的大模型的监督信息，来训练这个小模型。
知识蒸馏的主要思想是将一个大模型的知识转移到一个小模型中，使得小模型的性能接近于大模型的性能。这种方法可以用来将网络从大网络转化成一个小网络，并保留接近于大网络的性能；也可以将多个网络学到的知识转移到一个网络中，使得单个网络的性能接近整体的结果。
知识蒸馏的过程可以简单地描述为：将大模型的输出作为小模型的目标，同时在训练小模型时，加入大模型的输出作为辅助信息，从而使得小模型可以学到大模型的知识。

知识蒸馏的应用场景非常广泛，目前已经应用到图像语义识别，目标检测等场景中，并且针对不同的研究场景，蒸馏方法都做了部分的定制化修改，同时，在行人检测，人脸识别，姿态检测，图像域迁移，视频检测等方面，知识蒸馏也是作为一种提升模型性能和精度的重要方法。

关注