End-To-End Memory Networks

最新推荐文章于 2022-09-26 16:56:10 发布

ryanloucc

最新推荐文章于 2022-09-26 16:56:10 发布

阅读量2.9k

点赞数 1

分类专栏： NLP Related

本文链接：https://blog.csdn.net/u014300008/article/details/52794821

版权

关键词End2End, Memory Networks, Multiple hops来源arXiv 2015.03.31 (NIPS 2015)问题当前 AI 研究面临两大问题：如何在回答问题时实现多个计算步骤如何描述序列数据的长距离依赖性本文尝试从 Memory Networks 入手，解决这两个问题。文章思路模型介绍在单层模型中模型将 document 中的每一个 word 保存为一个

摘要由CSDN通过智能技术生成

关键词

End2End, Memory Networks, Multiple hops

来源

arXiv 2015.03.31 (published at NIPS 2015)

问题

当前 AI 研究面临两大问题：

如何在回答问题时实现多个计算步骤
如何描述序列数据的长距离依赖性

本文尝试从 Memory Networks 入手，解决这两个问题。

文章思路

模型介绍 在单层模型中模型将 document 中的每一个 word 保存为一个 memory $m_i$ ，每个memory 本质上就是一个向量，这一点与 embedding 是一回事，只是换了一个名词。另外每个 word 还与一个输出向量 $c_i$ 相关联。可以理解为每个 word 表示为两组不同的 embedding A 和 C。同样的道理，query 中的每个单词可以用一个向量来表示，即对应着另一个 embedding B。

MemN2N

在 Input memory 表示层，用 query 向量与 document 中每个单词的 $m_i$ 作内积，再用 softmax 归一化得到一组权重，这组权重就是 attention，即 query 与 document 中每个 word 的相关度。

接下来，将权重与 document 中的另一组 embedding $c_i$ 作加权平均得到 Output memory 的表示。这一步也称作 support memory。

最后，利用 query 的表示和 output memory 的表示去预测answer。

根据单层模型的结构，非常容易构造出多层模型。每一层的 query 表示等于上一层 query 表示与上一层输出 memory 表示的和 (还有很多其他结合方式)。每一层中的 A 和 C embedding 有两种模式：

第一种是邻接，即 $A^{k+1} = C^k$ ，依次递推
第二种是类似于 RNN 中共享权重的模式，

最低0.47元/天解锁文章

ryanloucc

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
End-To-End Memory Networks

关键词End2End, Memory Networks, Multiple hops来源arXiv 2015.03.31 (NIPS 2015)问题当前 AI 研究面临两大问题：如何在回答问题时实现多个计算步骤如何描述序列数据的长距离依赖性本文尝试从 Memory Networks 入手，解决这两个问题。文章思路模型介绍在单层模型中模型将 document 中的每一个 word 保存为一个
复制链接

扫一扫

专栏目录