记忆网络之Gated End-To-End Memory Networks

最新推荐文章于 2024-06-27 14:36:59 发布

liuchongee

最新推荐文章于 2024-06-27 14:36:59 发布

阅读量1.5k

点赞数

分类专栏：深度学习 nlp QA 深度学习与NLP--论文笔记和TensorFlow实现 QA_对话机器人_机器阅读专题文章标签：记忆网络深度学习 QA 对话系统 NLP

本文链接：https://blog.csdn.net/liuchonge/article/details/78439794

版权

本文介绍了Gated End-to-End Memory Networks，该模型借鉴了Highway Networks和Residual Networks的快捷连接，通过门控机制优化Memory Networks，提升在多事实问答、位置推理和对话系统中的性能。实验结果显示，模型在bAbI数据集和dialog bAbI对话数据集上表现出色。

摘要由CSDN通过智能技术生成

记忆网络之Gated End-to-End Memory Networks

今天要介绍的论文“gated end-to-end memory networks”时16年10月份发布的，他是在End-To-End Memory Networks这篇论文的基础上做了一些修改。因为End-To-End Memory Networks在multi-fact QA、 positional reasoning、 dialog等领域的效果还不是很好，所以本文参考CV领域中HighWay Networks和Residual Networks涉及到的shortcut connections，引入Gated机制，以实现对memory的正则化，从而让模型可以动态的修改memory。

因为End-To-End Memory Networks已经很熟悉了，所以我们先来介绍一下Highway Networks的想法，其主要是在网络输出下一层之前引入了一个transform gate T和一个carry Gated C，以让网络学习什么、多少信息应该被传到下一层。我们假设本层网络的输出为：y=H(x)，那么就加入下面的映射函数：