【论文阅读】MemNN

最新推荐文章于 2022-03-08 15:04:51 发布

没有胡子的猫

最新推荐文章于 2022-03-08 15:04:51 发布

阅读量309

点赞数

分类专栏：论文阅读文章标签：深度学习机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_39827677/article/details/118642884

版权

本文探讨了Memory Networks（MemNN）作为传统RNN长期记忆问题的解决方案。MemNN由输入、泛化、输出和回复四个组件构成，能够通过学习更新和检索内存。在文本应用中，它在问答任务上表现出色，尤其是在多步推理任务中。实验表明，MemNN在处理复杂问题时优于RNN和LSTM，特别是在需要长期记忆的场景下。

摘要由CSDN通过智能技术生成

MemNN

Memory Networks：记忆网络

任务

传统的RNN和其改进模型虽然具有记忆功能，但是在长期记忆中表现并不好，Memory Networks的目的是实现长期记忆。

方法（模型）

MEMORY NETWORKS

组成：1个内存模块(m—用索引的数组)，4个组件(I,G,O,R—通过学习得到)

组件

$I$ :（输入特征映射）—— 将输入转换为内部特征表示。
$G$ :（泛化）—— 对于给定新的输入更新旧的内存。称之为泛化是因为在这个阶段网络有机会压缩并泛化其内存以供未来某些需要。
$O$ :（输出特征映射）—— 给定新的输入与当前的内存状态，产生新的输出（在特征空间中）。
$R$ :（回复）—— 将输出转换为特定格式的回复。比如，文本回复或者一个动作。

流程

输入 $x$ （可以是单词，句子，图片，音频）
将 $x$ 转为内部特征表示： $I (x)$
更新内存 $m_i$ ： $m_i= G(m_i, I(x), m), ∀i$
计算输出特征： $o = O (I (x), m)$
将输出特征解码，得到最终回复：

最低0.47元/天解锁文章

没有胡子的猫

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

没有胡子的猫 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。