蒸馏学习损失函数（KL）的代码

Dream Algorithm

已于 2024-01-08 13:02:14 修改

阅读量281

点赞数 1

文章标签： python 人工智能深度学习计算机视觉

于 2023-10-03 08:07:22 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/A2321161581/article/details/133513009

版权

class DistillKL(nn.Module):
    def __init__(self, temperature):
        super(DistillKL, self).__init__()
        self.T = temperature

    def forward(self, y_s, y_t):
        # print("y_s.shape:",y_s.shape)
        p_s = F.log_softmax(y_s/self.T, dim=1)
        p_t = F.softmax(y_t/self.T, dim=1)
        loss = F.kl_div(p_s, p_t.detach(), reduction='sum') * (self.T**2) / y_s.shape[0]
        return loss


class KL(nn.Module):
    def __init__(self, temperature,alpha,beta):
        super(KL, self).__init__()
        self.p = 2
        self.kd = DistillKL(temperature=temperature)
        self.alpha = alpha
        self.beta = beta

    def forward(self, o_s, o_t, g_s, g_t):
        loss = self.alpha * self.kd(o_s, o_t)
        loss += self.beta * sum([self.at_loss(f_s, f_t.detach()) for f_s, f_t in zip(g_s, g_t)])

        return loss

    def at_loss(self, f_s, f_t):
        return (self.at(f_s) - self.at(f_t)).pow(2).mean()

    def at(self, f):
        return F.normalize(f.pow(self.p).mean(1).view(f.size(0), -1))

第一个类是只有logits蒸馏的损失度量函数，第二个类是结合了logtis和特征蒸馏的损失函数。

Dream Algorithm

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
蒸馏学习损失函数（KL）的代码

神经网络的损失度量
复制链接

扫一扫

Dream Algorithm CSDN认证博客专家 CSDN认证企业博客

码龄3年

37: 原创

118万+: 周排名

5万+: 总排名

3万+: 访问

: 等级

510: 积分

45: 粉丝

116: 获赞

14: 评论

208: 收藏

私信

关注

热门文章

最新评论

特征增强自蒸馏卷积神经网络
sw10124: 不亏是石老师高徒，太厉害了
使用grad_cam生成自己的模型的热力图
weixin_43912852: 请问target_category = 4这个是什么来填写的，数据集里面没有这个
使用grad_cam生成自己的模型的热力图
weixin_48008327: 这段代码报错怎么办呢？ output = output[0] # 注意：如果模型是多输出，需要选择自己想要的输出 for i in range(len(target_category)): loss = loss + output[i, target_category[i]] 报错内容：RuntimeError: grad can be implicitly created only for scalar outputs
使用grad_cam生成自己的模型的热力图
我家楼下有条狗: 博主您好，请问这个代码可以实现在yolo上的gradcam图输出吗
Mathtype中Max、Min无法斜体解决
CSDN-Ada助手: 非常感谢您的分享！解决技术问题并分享经验是博客的精髓所在。既然您已经成功解决了Mathtype中Max、Min无法斜体的问题，为什么不写一篇详细的技术博文分享给更多的人呢？我建议您写一篇关于Mathtype常见问题解决方法的博客，可以涵盖一些像这个问题一样的技术小疑问，通过提供解决方案帮助其他用户更好地应用Mathtype。期待您的下一篇博客！ 2023年博客之星「城市赛道」年中评选已开启（https://activity.csdn.net/creatActivity?id=10470&utm_source=blog_comment_city ），博主的原力值在所在城市已经名列前茅，持续创作就有机会成为所在城市的 TOP1 博主（https://bbs.csdn.net/forums/blogstar2023?typeId=3152981&utm_source=blog_comment_city），更有丰厚奖品等你来拿~。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。