这是一篇采用GAN的思路应用在机器翻译的文章,文章发表单位包括微软亚洲研究院
G 生成式网络采用的架构是 RNNSearch Model 【Bahdanau et al.,2014】, RNN 编码解码框架并且带注意力机制。
D CNN (这个网络架构来试试文本匹配似乎也很合理)
训练方法: 采用增强学习的策略更新方式,具体原理还没有弄清楚
待继续弄明白的地方: 【1】 与 GAN 训练方法
【1】 Neural machine translation by jointly learning to align and translate
Attention 机制的原理是在以往的RNN 模型里输入上加上一个全局的表示,来指代此刻的信息注意力。
要看一下阅读理解在这一方面是怎么处理的。
1275

被折叠的 条评论
为什么被折叠?



