《Pointer Networks》

最新推荐文章于 2024-05-09 11:43:31 发布

为什么四川人喜欢日李先人

最新推荐文章于 2024-05-09 11:43:31 发布

阅读量576

点赞数

分类专栏：自然语言处理深度学习文章标签： pointer-network

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_34325086/article/details/101672916

版权

这周读的是《Pointer Networks》这篇文章。作者是Google brain和UC Berkeley的研究人员，作者在本文中通过对编码器-解码器机制和注意力机制进行改进，提出了新的网络结构pointer network，并将其运用到解决组合最优化问题。下图为seq2seq模型与指针网络的对比：

可以看出传统的seq2seq模型最终产生的是一个序列，且序列中包含的元素个数与输入序列中的元素个数相同；指针网络则是产生了一个指针，通过解码器之后通过计算对应的注意力系数产生到输入序列对应元素的指针。

作者的改进是通过对注意力机制进行改进实现的，传统的注意力机制是通过计算解码器中的隐层向量同编码器各个阶段输出的隐层向量的相关性，加权之后作为额外信息输入到解码器，起到软对齐的作用，来提高模型的性能。其计算过程如下：

改进之后的注意力机制则是将第二三步省略直接通过对向量u进行softmax得到系数最大相关向量，由此产生指针。

最低0.47元/天解锁文章

为什么四川人喜欢日李先人

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
《Pointer Networks》

这周读的是《Pointer Networks》这篇文章。作者是Google brain和UC Berkeley的研究人员，作者在本文中通过对编码器-解码器机制和注意力机制进行改进，提出了新的网络结构pointer network，并将其运用到解决组合最优化问题。下图为seq2seq模型与指针网络的对比：可以看出传统的seq2seq模型最终产生的是一个序列，且序列中包含的元素个数与输入序列中...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。