注意力机制Effective Approaches to Attention-based Neural Machine Translation

最新推荐文章于 2021-10-31 19:27:57 发布

望长安于日下

最新推荐文章于 2021-10-31 19:27:57 发布

阅读量175

点赞数

分类专栏：深度学习文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_26884501/article/details/114641296

版权

Effective Approaches to Attention-based Neural Machine Translation
nlp三大顶会：ACL、EMCNLP、NACL
学起于思，思起于疑
合抱之木，生于毫末，九层之台，起于垒土，千里之行，始于足下
NMT 神经机器翻译neural Machine transtation
eos sos bos end、star of sentence
端到端模型：撒见和训练都非常的简单
符合人类的翻译直觉，即阅读源的一句话，-明白意思–翻译成目标的一句话

seq2seq缺点
1、encoder将长句压缩成一个向量很难

2、decoder解码的时候会遗忘encoder的信息：
解决方式：将encoder的输出向量送到decoder的每一个时间步，即rnn神经网络
Learning Phrase Representations using RNN Encoder–Decoder for Statistical Machine Translation

借助对齐的思想，翻译到某个词是，从源语言中找相关的词，让翻译更加的简单
Neural Machine Translation by Jointly Learning to Align and Translate

注意力机制
有很多信息，有些是有用的吗，，有些是没用的，如何自动去寻找目前这个状态下的有用信息
比如下图，y可能只与bc这两个词有关，而Z可能只与D有关
在这里插入图片描述
lcoal
hard attention 关注局部的词比如0.1 0.2 0.1 0.2 0.4这几个词只会关注0.4，但是本文中的local使用了小的窗口，实现了lcoal的效果

最低0.47元/天解锁文章

望长安于日下

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
注意力机制Effective Approaches to Attention-based Neural Machine Translation

Effective Approaches to Attention-based Neural Machine Translationnlp三大顶会：ACL、EMCNLP、NACL学起于思，思起于疑合抱之木，生于毫末，九层之台，起于垒土，千里之行，始于足下NMT 神经机器翻译neural Machine transtationeos sos bos end、star of sentence端到端模型：撒见和训练都非常的简单符合人类的翻译直觉，即阅读源的一句话，-明白意思–翻译成目标的一句话s
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。