论文阅读：Adding Attentiveness to the Neurons in Recurrent Neural Networks

最新推荐文章于 2022-12-08 13:17:51 发布

小吴同学真棒

最新推荐文章于 2022-12-08 13:17:51 发布

阅读量273

点赞数

分类专栏：人工智能学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_36627158/article/details/116500036

版权

骨架点动作识别骨架点动作识别 Attention RNN

学习同时被 2 个专栏收录

115 篇文章 7 订阅

订阅专栏

72 篇文章 5 订阅

订阅专栏

目录

Details (Implementation)

原来的 RNN 结构

变为 Element-wise-Attention Gate (EleAttG) 后

论文名称：Adding Attentiveness to the Neurons in Recurrent Neural Networks（2018 ECCV）

下载地址：https://arxiv.org/pdf/1807.04445.pdf

Summary

在以 RNN 为基础的相关结构中，gate 用来控制信息的流动。但作者认为，gate 对信息流的控制是把输入看做一个整体，只关注了当前信息和历史信息的贡献，而没有去挖掘一个时间戳输入里不同元素的不同重要程度。

所以，作者提出在 RNN 相关的结构中加入注意力机制，变为 Element-wise-Attention Gate (EleAttG) 结构，给输入里不同元素赋予不同的重要程度。

其中，注意力机制体现在由当前的输入和隐藏层的状态共同决定输入里每个元素的重要性，形成一个 attention map，用这个 attention map 对当前输入进行重要性程度的更新，再对更新后的输入进行后续 RNN 的操作。

此外，作者设计的 attention map 又与之前的 attention 机制不太一样：之前的 attention 使用 Softmax 函数作为激活函数，这样会导致 attention map 的加和为 1，可能会互相制约每个元素的 response value。而文中使用的是 sigmoid 函数作为激活函数，去除掉了这个加和为 1 的限制。

Details (Implementation)

原来的 RNN 结构

For a standard RNN layer, the output response ht at time t is calculated based on the input xt to this layer and the output ht−1 from the previous time slot

变为 Element-wise-Attention Gate (EleAttG) 后

For an RNN block, we propose an Element-wise-Attention Gate (EleAttG) to enable the RNN neurons to have the attentiveness capability. The response of an EleAttG is a vector at with the same dimension as the input xt of the RNNs, which is calculated as

小吴同学真棒

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
5
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

小吴同学真棒 CSDN认证博客专家 CSDN认证企业博客

码龄8年

132: 原创

4万+: 周排名

1万+: 总排名

24万+: 访问

: 等级

2900: 积分

322: 粉丝

348: 获赞

271: 评论

1021: 收藏

私信

关注

热门文章

分类专栏

latex 1篇
学习 115篇
人工智能 72篇
日常学习 4篇
PyTorch 16篇
leetcode 1篇
c语言 25篇
英文学术论文写作 1篇
Python 8篇
环境配置 6篇
自律 1篇
Linux 1篇
tensorflow 3篇
PAT 15篇
Matlab 5篇
数据结构 1篇
开发 1篇
MAC 1篇

最新评论

Hi-TRS：骨架点视频序列的层级式建模及层级式自监督学习
weixin_51440200: 你好，想请问一下Discriminative Pretext task中的负样本是在论文和代码的哪里看出来的？
InstDisc 代码解读
diligent啊豆豆: 作者大大您好！我想请问一下这篇文章中用KNN做分类判定是怎么样做的呢？文中是说拿测试样本的特征向量与他之前训练集存储的特征向量之间做余弦相似度，然后再用KNN抽出附近K个特征向量s_i，求exp（s_i / t），然后做加权，但是我搞不懂他是怎么样分类的，难道他存储起来的训练集的特征向量是有标签的吗？
【论文阅读笔记】（2022 ECCV）CMD: Self-supervised 3D Action Representation Learning with Cross-modal Mutual Di
归昼: 从 B 模态的 Memory Bank 中找出和该特征向量最相近的 K 个特征向量，计算得到特征向量感觉不对，应该都是从A模态选取的，相当于anchor。如果每个都选取自己相近的那么这个KL散度就没意义了原文表述: we select the top K nearest neighbors of $z^a_k$ anchors and compute the similarity distributions
InstDisc 代码解读
qq_40819479: 您好您知道 loss中的nlem是什么吗
使用 PyTorch 框架复现 Two-Stream 网络过程中遇到的问题
Wyccc.: 我在执行和calOpticalFlow.m文件有关的代码时，报错matlab路径中未找到指定的文件名，多次修改后也无果，如果有解决办法还希望能帮助一下，谢谢！

最新文章

目录

评论 5

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。