知识蒸馏系列总结整理(一)(2022/06/23)

本文介绍了知识蒸馏的概念,即使用复杂模型的软标签训练学生网络,探讨了数据从硬标签到软标签的转变对性能的影响,以及该方法在减少数据标注需求和简化网络结构上的应用。作者提出了对交叉熵函数的质疑,并讨论了模型的预训练性质和无标注数据的学习潜力。
摘要由CSDN通过智能技术生成

基于神经网络的知识蒸馏方法最早在2014年提出:

其过程可以理解为使用复杂模型(优质模型)得到的预测结果(软标签)来训练学生网络,学生网网络同时输入软标签得到结果【与教师网络的软标签进行对比(此刻交叉熵的系数不仅有0和1)】和硬标签得到的结果(此时如果不进行这一步则可以实现无样本学习)。

具体内容参考B站up主 同济子豪兄 【【精读AI论文】知识蒸馏_哔哩哔哩_bilibili】的学习视屏,对该成果和方法有如下总结:

1、数据的标注(标签决定了结果):提升baseline的核心是数据由独热编码的hard target变成了能够表示相似度(?,这里依旧存疑)的soft target,因此可以理解为是数据层面的改变导致了学习性能的改变。【从侧面对交叉熵函数的优劣也进行了质疑(不关注标签不一致类别的得分而仅关注标签一致类别的结果),这里同时引出了均方差损失函数(对soft target的计算可否使用MSE损失函数)】

2、针对复杂网络与简易网络的定义(还未读完全文

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值