注意力机制原理_Attention注意力机制

最新推荐文章于 2024-05-30 14:32:14 发布

weixin_39520013

最新推荐文章于 2024-05-30 14:32:14 发布

阅读量551

点赞数

文章标签：注意力机制原理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39520013/article/details/111614685

版权

注意力机制再NLP领域十分的火热，他克服了以往seq2seq翻译定位不准的问题，加强了词的前后联系，能够根据当前的语境，合理的分配候选词的权重，提升翻译的准确率。

注意力机制的原理便是寻找当前语境（当前状态）与各个候选词之间的匹配度，计算各个候选词的得分，最终选取合成最佳的词汇。

如上图所示，再decoder进行翻译解码时，会根据当前的状态，与encoder中的各个词汇的编码输出计算一个得分（步骤一）；计算完得分后，所有的得分经过一个softmax进行了归一化，然后得分成encoder编码（步骤二）；再将其编码求和（得分*编码相当于对编码进行加权求和）（步骤三）；最后，addition与上一状态求解出下一个词的翻译。（上图参考链接：https://www.cnblogs.com/ydcode/p/11038064.html）

目前主流的计算得分的方式有以下三种：

上图来自：https://blog.csdn.net/xiaosongshine/article/details/90573585

weixin_39520013

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
注意力机制原理_Attention注意力机制

注意力机制再NLP领域十分的火热，他克服了以往seq2seq翻译定位不准的问题，加强了词的前后联系，能够根据当前的语境，合理的分配候选词的权重，提升翻译的准确率。注意力机制的原理便是寻找当前语境（当前状态）与各个候选词之间的匹配度，计算各个候选词的得分，最终选取合成最佳的词汇。如上图所示，再decoder进行翻译解码时，会根据当前的状态，与encoder中的各个词汇的编码输出计算一个得分（步骤一）...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。