Effective Approaches to Attention-based Neural Machine Translation 学习笔记

Effective Approaches to Attention-based Neural Machine Translation 学习笔记

本文是阅读 Effective Approaches to Attention-based Neural Machine Translation 之后的学习总结,如有不妥之处,烦请各位斧正。

0. 概述

这篇论文重在研究基于attention的神经机器翻译模型,测试了两种简单有效的attention机制:
1. 全局方法:总是关注所有的源单词。比前人的方法结构上更简单。
2. 局部方法:每次只关注源单词的一个子集。比全局方法或者soft attention花销要更小,同时与hard attention不同的是,更容易实现和训练。另外,可以在这些基于attention的模型测试不同的对齐函数。
论文中除了在WMT翻译任务中测试英德互译之外,还根据学习能力,处理长句子的能力,attention机制的选择,对齐质量和翻译的输出来对模型进行评估。

1. 神经机器翻译(NMT)

神经机器翻译系统是定向地将翻译源句,就是将x1,……,xn翻译成目标句子,y1,……,ym的条件概率建模的神经网络。NMT的基本形式包含两个组成成分:
1. 编码器:计算得到每个源句的表

  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值