论文笔记:Evolving Losses for Unsupervised Video Representation Learning

Evolving Losses for Unsupervised Video Representation Learning 论文笔记

Distillation

Knowledge Distillation from: zhihu

Distillate Knowledge from Teacher model Net-T to Student model Net-S.
在这里插入图片描述

目的:为了精简模型方便部署。

L = α L s o f t + β L h a r d L=\alpha L_{s o f t}+\beta L_{h a r d} L=αLsoft+βLhard

L s o f t = − ∑ j N p j T log ⁡ ( q j T ) ,  where  p l T = exp ⁡ ( v i / T ) ∑ k N exp ⁡ ( v k / T ) , q i T = exp ⁡ ( z i / T ) ∑ k N exp ⁡ ( z k / T ) L_{s o f t}=-\sum_{j}^{N} p_{j}^{T} \log \left(q_{j}^{T}\right), \text { where } p_{l}^{T}=\frac{\exp \left(v_{i} / T\right)}{\sum_{k}^{N} \exp \left(v_{k} / T\right)}, q_{i}^{T}=\frac{\exp \left(z_{i} / T\right)}{\sum_{k}^{N} \exp \left(z_{k} / T\right)} Lsoft=jNpjTlog(qjT), where plT=kNexp(vk/T)exp(vi/T),qiT=kNexp(zk/T)exp(zi/T)

L h a r d = − ∑ j N c j log ⁡ ( q j 1 ) ,  where  q i 1 = exp ⁡ ( z i ) ∑ j N exp ⁡ ( z j ) L_{h a

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值