End to End Memory network

最新推荐文章于 2021-11-14 08:41:49 发布

lainegates

最新推荐文章于 2021-11-14 08:41:49 发布

阅读量580

点赞数

分类专栏： # tensorflow 深度学习文章标签： memory network tensorflow

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/LaineGates/article/details/79140583

版权

深度学习同时被 2 个专栏收录

8 篇文章 0 订阅

订阅专栏

5 篇文章 0 订阅

订阅专栏

关键词

End2End, Memory Networks, Multiple hops

来源

arXiv 2015.03.31 (published at NIPS 2015)

特色

设计了全新网络，相对于LSTM，以词为单位的时序，memory network是以句子为单位。

解决方案

原图
这里写图片描述
加备注图

计算过程

按原图

lookup词表A获得句子向量表示，
$m_i=Ax_i$ , $i$ 大小是memory size
计算attention，或者说计算输入的权重
$p_i = softmax(u^T m_i)$

将输出乘权重，得到最终的输出o
输出的嵌入向量
$c_i = C out_i$ , $i$ 大小是memory size
最终输出嵌入向量
$o = \sum_{i} p_i c_i$
查询的嵌入向量
$u=Bq$
预测结果
$\hat{a}=softmax(W(o+u))$

按实现代码

计算过程与原图不一致，我按论文的实现代码做了标注，参见备注图。
输入sentences和query时，都有矩阵TA和TB矩阵
即
$A_{in}=Ax_i +T_Ax_i$ , i代表句子，长度固定为memory size
$A_{out}=A_{in} H_{last}$ , H代表隐藏层, $A_{out}可看作m_i$
$p_i=softmax(A_{out})$
$B_{in}=Bq + T_Bq$
$B_{out}=p B_{in}$
$C_{out}=H_{last} B_{out}$
$D_{out}=C_{out} B_{out}$
最后，保存 $D_{out}$ 为新的Hidden

多层网络

原文提供两种方式。
第一种是邻接，即 $A_{k+1}=C_k$ ，依次递推
第二种是类似于 RNN 中共享权重的模式， $A_1=A_2=…=A_k$ ， $C_1=C_2=…=C_k$ 。
其余与单层网络一致。

参考代码

facebook实现，使用Lua语言
网友实现，使用tensorflow

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
End to End Memory network

关键词End2End, Memory Networks, Multiple hops来源arXiv 2015.03.31 (published at NIPS 2015)特色设计了全新网络，相对于LSTM，以词为单位的时序，memory network是以句子为单位。解决方案原图加备注图计算过程按原图lookup词表A获得句子
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。