学生-教师模型 与 知识蒸馏

学生-教师模型

Student and Teacher network指一个较小且较简单的模型(学生)被训练来模仿一个较大且较复杂的模型(教师)的行为或预测。
教师网络通常是一个经过训练在大型数据集上并在特定任务上表现良好的模型。而学生网络被设计成计算效率高且参数较少的模型。
其目标是在减少计算资源需求和提高推理速度的同时,尽可能地接近教师网络的性能。

主要思想是利用教师网络的知识和经验来指导学生网络的学习过程。

训练Student and Teacher network的过程被称为"知识蒸馏"。它涉及使用教师网络的预测结果和真实标签来训练学生网络。
学生网络的损失函数通常由两部分组成:标准的交叉熵损失和蒸馏损失。蒸馏损失用来度量学生的预测与教师的软化、更概率化的输出之间的接近程度。

知识蒸馏

训练Student and Teacher network的过程称为知识蒸馏。
用于将一个大型、复杂的模型的知识转移给一个小型、简单的模型。
它的主要目标是让小型模型能够模仿大型模型的行为,并且在学习过程中,将大型模型的"知识"蒸馏(传递)给小型模型,使得小型模型在表现上能够接近或者甚至超过大型模型。

  • 6
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值