PAYING MORE ATTENTION TO ATTENTION：

最新推荐文章于 2023-04-16 22:15:35 发布

冰菓(笑)

最新推荐文章于 2023-04-16 22:15:35 发布

阅读量6.1k

点赞数 4

分类专栏：知识蒸馏每周论文阅读

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/a362682954/article/details/90403047

版权

该博客介绍了一种通过注意力转移提高卷积神经网络性能的方法，通过教师网络生成的注意力图指导学生网络学习，使学生网络能捕获到教师网络的注意力模式。论文和相关代码链接提供，实验表明此方法有效。

摘要由CSDN通过智能技术生成

PAYING MORE ATTENTION TO ATTENTION : IMPROVING THE PERFORMANCE OF C NVOLUTIONAL NEURAL NETWORKS VIA ATTENTION TRANSFER

论文地址：https://arxiv.org/abs/1612.03928

github地址：https://github.com/szagoruyko/attention-transfer

文章的提出的模型结构很朴素，和大部分的知识蒸馏方式相同，教师网络通过生成的注意力图（attentior map）来指导学生网络的注意力图学习，通过attention transfer 缩小学生attentior map 和教师网络attentior map 的距离使得学生网络学习到教师网络的注意力图。这样学生网络学习到了这些知识，便能够生成尽可能与教师网络相似的特征图。

这边提一点，在学习中间层特征图，不管是热力图，注意力图还是普通的特征图，两个网络在这个地方的大小是一致的，这样才能通过距离度量计算特征图的距离。

这是hint loss的思想，不同于hint loss只是单纯缩减特征图，而是将特征图转化为注意力图，使得学生网络模型学习到的不单纯只是特征图信息，而是真正的学到里面的特征。使得学生网络生成的特征图更加灵活，不局限于教师网络的特征图。

最低0.47元/天解锁文章

关注

4
点赞
踩
11

收藏

觉得还不错? 一键收藏
2
评论
PAYING MORE ATTENTION TO ATTENTION：

PAYING MORE ATTENTION TO ATTENTION : IMPROVING THE PERFORMANCE OF C NVOLUTIONAL NEURAL NETWORKS VIA ATTENTION TRANSFER论文地址：https://arxiv.org/abs/1612.03928github地址：https://github.com/szagoruyko/at...
复制链接

扫一扫

专栏目录

冰菓(笑) CSDN认证博客专家 CSDN认证企业博客

码龄9年

132: 原创

3万+: 周排名

129万+: 总排名

49万+: 访问

: 等级

5999: 积分

154: 粉丝

224: 获赞

236: 评论

910: 收藏

私信

关注

热门文章

分类专栏

NLP 1篇
软件环境安装 2篇
深度学习 8篇
tensorflow 4篇
部署
爬虫 1篇
darknet 1篇
ocr 1篇
机器学习 13篇
python 17篇
ubuntu 8篇
研电赛 4篇
医疗图像 6篇
pytorch 24篇
opencv 12篇
论文修改 3篇
incremental learning 6篇
keras 7篇
目标检测 40篇
算法 21篇
C++ 23篇
知识蒸馏 2篇
faster-rcnn 7篇
YOLOV3 5篇
每周论文阅读 3篇
图像处理 7篇

最新评论

pytorch: DiceLoss MulticlassDiceLoss
YorkCOSYAO: 如果loss依然为负数也没有关系，（我猜想大概率仍然是smooth取得不合理）。直接用负loss一样可以实现优化： class dice_coef(nn.Module): def __init__(self): super(dice_coef, self).__init__() def forward(self, y_true, y_pred, smooth=1e-7): y_true_f = y_true.flatten() y_pred_f = y_pred.flatten() intersection = torch.sum(y_true_f * y_pred_f) return (2. * intersection + smooth) / (torch.sum(y_true_f) + torch.sum(y_pred_f) + smooth) class dice_coef_multilabel(nn.Module): def __init__(self): super(dice_coef_multilabel, self).__init__() def forward(self, y_true, y_pred, numLabels=3): dice = 0 for index in range(3): dice -= dice_coef()(y_true[:, index], y_pred[:, index]) return dice
pytorch: DiceLoss MulticlassDiceLoss
YorkCOSYAO: 出现负值的原因是因为smooth，参考用户‘孙良怀’的评论：loss = 2 * (intersection.sum(1) + smooth) / (input_flat.sum(1) + target_flat.sum(1) + smooth) 我认为应该写作： loss = (2*intersection.sum(1) + smooth) / (input_flat.sum(1) + target_flat.sum(1) + smooth) 。smooth应该加在括号里面。不然分子加了两个smooth，分母只加了一个
pytorch 自己的图片数据处理成可以训练的图片类型
编程进阶0.1: from torch.utils.data import Dataset import numpy as np class Dataset(Dataset): def __init__(self, path_img, path_target, transforms=None): self.train = path_img self.targets = path_target self.transforms = transforms def __len__(self): return len(self.train) def __getitem__(self, idx): img = self.train[idx] target = self.targets[idx] if self.transforms: img = self.transforms(img) target = self.transforms(target) return img, target 可以说一下这段代码的原理吗？
关于pytorch 模型复制的一些问题
cyh19971997: 在循环里deepcopy造成显存飙升最后CUDA 显存炸了。你遇见过吗
pytorch 从头开始faster-rcnn 最后：使用自己的数据集
晴明大大: 好久了，我也忘了

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。