对Feature map的值的思考

Blizzard_v

已于 2023-03-16 14:31:41 修改

阅读量482

点赞数

分类专栏：深度学习文章标签：深度学习机器学习 feature map

于 2022-05-19 13:50:51 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Rolandxxx/article/details/124861116

版权

深度学习专栏收录该内容

20 篇文章 6 订阅

订阅专栏

Feature map的值的思考

认为 “feature map为0的地方是没学到特征的地方，还有就是特征图上值越大起的决策作用越大” 这一说法是错误的。
首先要知道什么叫起作用，起作用就是这个点的特征值和输出值是强相关的，即它只要变化一点就会引起输出的剧变。 因为最后输出的结果是由特征值x和权重w共同决定，而且对于二分类任务来说sigmoid输出是0和是1都是有效的，所以不能以这样的方式理解！不同的卷积核可以看作对图片的不同操作。feature map为0或者为正为负没有本质的区别，都是信息的一种表示，不同的卷积核就是不同表示信息的方法，而激活函数则是决定了选择信息的方式，只是relu正好选择了正值而已，神经网络经过训练后，卷积核自然就把有用的信息通过正值表示出来。是relu决定了feature map正值有用。
在transformer中，那如何证明注意力分数越大，起的作用越大呢，可以求偏y/偏v（v指value，y指网络输出），如果v变了一点，y都会变得很剧烈，就说明v对y的影响很大，而算一下偏y/偏v ，会发现乘上的注意力分数会是里面的一项。再比如grad-CAM可视化，求的是输出y（一个值）对特征图x的梯度值，即这一点的特征值对应的权重，主要其实看的是特征对输出的贡献，不一定指的是特征谁大谁小。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
对Feature map的值的思考

feature map为0或者为正为负没有本质的区别，都是信息的一种表示，不同的卷积核就是不同表示信息的方法，而激活函数则是决定了选择信息的方式，只是relu正好选择了正值而已，神经网络经过训练后，卷积核自然就把有用的信息通过正值表示出来。在transformer中，那如何证明注意力分数越大，起的作用越大呢，可以求偏y/偏v（v指value，y指网络输出），如果v变了一点，y都会变得很剧烈，就说明v对y的影响很大，而算一下偏y/偏v ，会发现乘上的注意力分数会是里面的一项。
复制链接

扫一扫

专栏目录

博客等级

码龄5年

188
原创

293
点赞

1413
收藏

4222
粉丝

关注

私信

热门文章

分类专栏

最新评论

深度理解CNN中的感受野（大杀器）
CodeNotSmell: 请问有参考资料吗？文章中的图是来自什么课程吗老哥
CNN中的底层、高层特征、上下文信息、多尺度
Blizzard_v: 谢谢指出细节，你这样理解也是对的。我文章所站的角度与你不同，感受野和多尺度这两个概念往高层抽象来看其实是相同的，然后我文章的目的是为了用感受野的思想来让大家更简单快速的理解多尺度这个概念。
CNN中的底层、高层特征、上下文信息、多尺度
୧⍤⃝238: 我觉得你理解的不对。多尺度和感受野不是一回事。拿图像来说。多尺度是针对同一“整”张图像的，你可以看一下高斯金字塔，拉普拉斯金字塔。感受野是对同一张图的局部区域的来说的，当然感受野也可能是整个图像区域
关于C++函数返回值的使用方式以及局部对象何时析构的问题
鶸..: ＋1我的也是，创建临时对象时调试并不是拷贝构造，不知道是不是编译器的问题
CE Loss，BCE Loss以及Focal Loss的原理理解
2零年代: 谢谢博主，公式里i表示类别和表示样本的说明太棒了，瞬间解惑

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。