深度学习-知识蒸馏

第一章 综述

知识蒸馏1

知识蒸馏的目的是将大模型变成小模型,将小模型部署到移动终端设备上。

知识蒸馏

1.轻量化网络

轻量化网络1646222515171

2.知识的表示与迁移

hard targets和soft targets:hard_targets和soft_targets的对比

显然, soft targets包含更多的“知识”和“信息”, 像谁, 不像谁, 有多像,有多不像, 特别是非正确类别概率的相对大小(驴和车)。

3.蒸馏温度T

蒸馏温度T

把比较硬的soft targets变得更软,信息暴漏的更明显

例如:

知识蒸馏例子

第二章 知识蒸馏

1.过程

知识蒸馏过程1

教师网络进行预训练,生成soft labels,学生网络可能训练,也可能没有训练,生成了预测的soft predictions, 将教师网络的labels和学生的predictions做一个Loss, 同时学生网络也会生成一个hard prediction,它与真实标签的hard label做一个Loss(如上上图所示)。

1646224418659

2.实验结果

1646224577312

3.知识蒸馏的应用场景

模型压缩

优化训练,防止过拟合(潜在的正则化)

无限大、无监督数据集的数据挖掘

少样本、零样本学习

4.迁移学习和知识蒸馏

迁移学习指的是领域之间的迁移,例如将猫狗的识别迁移到医学图像的识别上去;知识蒸馏指的是模型之间的蒸馏。

第三章 知识蒸馏发展趋势

发展趋势

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值