THE GOLDILOCKS PRINCIPLE: READING CHILDREN’S BOOKS WITH EXPLICIT MEMORY REPRESENTATIONS

最新推荐文章于 2020-02-23 09:41:55 发布

ryanloucc

最新推荐文章于 2020-02-23 09:41:55 发布

阅读量931

点赞数

分类专栏： NLP Related 文章标签：阅读

本文链接：https://blog.csdn.net/u014300008/article/details/52774372

版权

NLP Related 专栏收录该内容

16 篇文章 0 订阅

订阅专栏

关键词

Memory Networks，CBT dataset

来源

arXiv 2015.11.07 (published at ICLR 2016)

问题

探索统计模型如何利用更广的上下文来做预测

文章思路

Memories 和 Queries 表示 考虑三种形式：

Lexical Memory 在 document 中每个词的 one-hot representation 代表一个 memory，并且将时间特征加入 embedding 中以反应位置信息。在 query 中 memory 采用要预测的词前 n 个词来表示。
Window Memory 在 document 中以候选答案为中心开一个窗口，用这个窗口内的词表示 memory。实验中采用了 bag of words 和每个 window 采用一个字典的方式编码，后者效果更好。在 query 中采用以要预测的词开一个窗口。
Sentential Memory：在 document 中每个句子对应一个 memory。同时使用 End-To-End Memory Networks 提出的 Positional Encoding 来对词的位置进行编码。在 query 中采用整个句子的 bag of words。

答案预测 利用上面提到的几种 memeory，将相关工作中的 End-To-End Memory Networks 相应的 memeory 做替换，可以得出答案。

self-supervision for window memories 在实验中发现，多跳网络只在 Lexical Memory 中起作用。于是尝试使用更简单的，单跳网络(答案只使用一个 memory)来利用更强的信息来学习。
Memory supervision 用以下方式推断：因为在训练时知道正确的答案，我们假设在 window memory 中正确的 support memory 所对应的候选答案就是正确的。通常不止一个 memory 包含正确的答案，模型自己通过 query 计算后选择得分最高的那一个答案。

资源

论文地址：https://arxiv.org/abs/1511.02301
数据地址：http://fb.ai/babi/

简评

实验说明传统的 N-gram 方法和 LSTM RNNLM 从 query本身出发就可以非常准确地预测出 Verbs 和 Preposition，不需要借助过多的 document context，但是对于前两类却束手无策。因此本文提出了用Memory Network来解决这个问题。

但是并不是所有的 Memory Network 都起作用，实验结果表明以候选答案为中心的 window memory 表现最好。而 window memory 加上 self-supervision (在训练时利用 max 函数而不是加权平均做 hard attention selection) 在 Named Entities, Common Nouns 表现突出。

另外，Memory Networks 最大的特点是能够扩展成多跳，这可以提供推理能力。

ryanloucc

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
THE GOLDILOCKS PRINCIPLE: READING CHILDREN’S BOOKS WITH EXPLICIT MEMORY REPRESENTATIONS

关键词Memory Networks，CBT dataset来源arXiv 2015.11.97 (published at ICLR 2016)问题探索统计模型如何利用更广的上下文来做预测文章思路Memories 和 Queries 表示考虑三种形式：Lexical Memory 在 document 中每个词的 one-hot representation 代表一个 memory，并且将时间
复制链接

扫一扫