[深度学习]Machine Comprehension机器阅读中Attention-based Model注意力机制论文集合

最新推荐文章于 2021-12-21 11:57:12 发布

Thorrrrrrrrrr

最新推荐文章于 2021-12-21 11:57:12 发布

阅读量775

点赞数

分类专栏：机器阅读机器学习神经网络深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sinat_33487968/article/details/84578815

版权

目录

机器阅读概念

网络结构比较

机器阅读概念

所谓机器阅读理解任务，指的就是给一段context描述，然后对应的给一个query，然后机器通过阅读context后，给出对应query的答案。这里做了一个假设，就是query的答案必须是能够在context原文中找到的一段话（也可以理解为连续的几个单词），也就是说最终模型预测的目标是输出两个下标，分别对应于query回答在context的开始位置和结束位置。最后模型的损失函数为多分类的交叉熵softmax（因为从本质上来讲该问题等效为一个多分类问题，问题的类别数等于context中单词的数量，也就是每一个单词都有可能作为answer的开始）。

论文集合

论文名称：《End-To-End Memory Networks》

论文地址：https://arxiv.org/pdf/1503.08895.pdf

论文代码：https://github.com/fchollet/keras/blob/master/examples/ba bi_memnn.py

针对Memory Networks无法端到端训练的弊端，提出了End-To-End Memory Networks，可以端到端训练，减少训练监督。增加了注意力机制，并且使用了RNNsearch中的multiple computational steps (hops)。hops的作用是增强模型的推理能力。

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
[深度学习]Machine Comprehension机器阅读中Attention-based Model注意力机制论文集合

目录机器阅读概念论文集合网络结构比较机器阅读概念所谓机器阅读理解任务，指的就是给一段context描述，然后对应的给一个query，然后机器通过阅读context后，给出对应query的答案。这里做了一个假设，就是query的答案必须是能够在context原文中找到的一段话（也可以理解为连续的几个单词），也就是说最终模型预测的目标是输出两个下标，分别对应于query回答在...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。