End-To-End Memory Networks

最新推荐文章于 2024-06-27 14:36:59 发布

ryanloucc

最新推荐文章于 2024-06-27 14:36:59 发布

阅读量3k

点赞数 1

分类专栏： NLP Related

本文链接：https://blog.csdn.net/u014300008/article/details/52794821

版权

本文探讨了端到端记忆网络（End-to-End Memory Networks）如何解决AI研究中的多步计算和长距离依赖问题。通过介绍模型结构，包括输入记忆表示、注意力机制和支持记忆，以及多层模型的构建方式，阐述了其在问答任务中的应用。文章还讨论了模型细节，如句子记忆表示的不同方式，并提供了相关资源和数据集信息。

摘要由CSDN通过智能技术生成

关键词

End2End, Memory Networks, Multiple hops

来源

arXiv 2015.03.31 (published at NIPS 2015)

问题

当前 AI 研究面临两大问题：

如何在回答问题时实现多个计算步骤
如何描述序列数据的长距离依赖性

本文尝试从 Memory Networks 入手，解决这两个问题。

文章思路

模型介绍 在单层模型中模型将 document 中的每一个 word 保存为一个 memory $m_i$ ，每个memory 本质上就是一个向量，这一点与 embedding 是一回事，只是换了一个名词。另外每个 word 还与一个输出向量 $c_i$ 相关联。可以理解为每个 word 表示为两组不同的 embedding A 和 C。同样的道理，query 中的每个单词可以用一个向量来表示，即对应着另一个 embedding B。