memory network 论文翻译

摘要

Memory Networks 通过结合长时记忆模块 和 推断模块 联合工作来进行推理。长时记忆模块可以进行读写,也为了用来预测。我们是为了问答系统来研究这个模型,长时记忆模块正作为问答系统的(类似内存的)知识库。

问题引出

现在的RNN记忆能力不行,本文解决这个问题。核心思想是弄一个读写的内存组件。

Memory Networks基本框架

一个Memory Networks包括一个内存m(也就是一个对象的数组,每个是-来表示)
以及4个会被训练的组件 I G O R:
I : (输入特征映射)–把输入转变成内部的特征表示
G : (生成)–在新的输入来了的时候更新旧的内存
O : (输出特征映射) – 给定新的输入和现在的内存状态,在特征表示空间 产生新的输出
R : (回馈结果) – 把输出转化为想要的格式,比如文本或者 动作Action

给一个输入x,x可以是 字,词,句子,图像,声音。然后:
1,把x转成内部特征表示I(x)
2,更新-,给定I(x)-
3,计算输出特征o,给定输入和内存

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值