知识蒸馏(FitNet)---学习笔记

  1. 原理是利用浅而宽的教师网络模型去训练窄而深的学生网络模型。其主要目的就是将一个训练好的大而复杂的模型中相关的知识,迁移到小而简单的学生模型中,以适应计算能力和计算效率要求很高的场合。
  2. 知识蒸馏网络划分的步骤:
    1. 确定教师网络,并训练成熟,将教师网络的中间层hint层提取出来;
    2. 设定学生网络,该网络一般较教师网络更窄、更深,将学生网络的中间层guided层提取出来;
    3. 由于guided层比与hint层窄,因此在guided层后添加回归器用于特征升维,以匹配hint层特征输出;
    4. 通过计算hint层的特征输出与回归器转化后的guided层特征均方差,即计算二者特征的距离,距离越短说明Loss越小,两者功能越接近,知识蒸馏越彻底。
  3. 直观算法图:

 

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 13
    评论
评论 13
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值