论文学习（翁荣祥毕业论文）

最新推荐文章于 2020-05-01 14:58:03 发布

Xiao_yanling

最新推荐文章于 2020-05-01 14:58:03 发布

阅读量404

点赞数 1

分类专栏：论文笔记

本文链接：https://blog.csdn.net/Xiao_yanling/article/details/90744478

版权

本文探讨了神经机器翻译中的挑战，提出词预测机制以改善初始状态生成，并利用句子级全局表示增强翻译质量。介绍了词预测在解码过程中的应用，以及胶囊网络在构建全局状态表示中的潜在作用。同时，论文还提出了一种双向记忆交互式解码策略，以解决Seq2Seq模型的局限性，允许更灵活的翻译修改。

摘要由CSDN通过智能技术生成

基础知识

1.存在的问题：双语数据的规模与神经网络的参数规模的不平衡，导致现有的神经机器翻译模型生成的向量表示无法包含有足够语言信息。
2.基于规则的翻译方式->统计机器翻译（步骤如
https://www.cnblogs.com/wuseguang/p/4072920.html

1.语料预处理，生成双语分词之后的文件。2.词对齐。3.短语抽取。4.计算短语概率。5.最大熵调序。）->神经机器翻译。
3.神经机器翻译模型结构：
编码器-解码器（常见神经网络：RNN，CNN，SAN（自注意力神经网络（Self-Attention Network）））

基于循环神经网络的神经机器翻译模型：
使⽤⼀个双向循环神经⽹络构成的编码器将给定的源端句⼦的词向量（Word Vector）编码成⼀组向量表⽰并且将这组隐层状态表⽰合成⼀个初始状态（Initial State）输⼊到解码器中，⽽解码器使⽤⼀个单向的循环神经⽹络进⾏逐词解码。这其中每输出⼀个⽬标词之前都会通过注意⼒机制来对源端编码成的状态表⽰进⾏计算，从⽽获取需要输出的⽬标词的在源端的信息。

具体模型架构见前面笔记
在这里插入图片描述

基于自注意力网络的神经机器翻译模型：
在这里插入图片描述

翻译质量评价：

BlEU：通过计算翻译结果中的N元文法（N-garm）和参考译文中的N元文法的匹配成功率来评估翻译质量。
具体计算方法：
$BLEU=BP*exp\sum^N_{n=1}w_nlogp_n$
$w_n$ ：n元文法中的重要性？
$B P$ ：长度惩罚因子，避免生成的翻译结果过短。?
$BP=\{^{1\ \ \ \ \\ \ \ \ \ \ t>r}_{e^{\frac{1-r}{t}\ \ \ \ \ \ \ \ \ t\le{r}}}$
$p_n=\frac{\sum_{e\in{Translation}}\sum_{n-garm\in{e}}Count_{clip}(n-gram)}{\sum_{e^{'}\in{Referance}}\sum_{n-garm\in{e^{'}}}Count(n-gram)}$

最低0.47元/天解锁文章

Xiao_yanling

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
论文学习（翁荣祥毕业论文）

1.存在的问题：双语数据的规模与神经网络的参数规模的不平衡，导致现有的神经机器翻译模型生成的向量表示无法包含有足够语言信息。2.基于规则的翻译方式->统计机器翻译（步骤如https://www.cnblogs.com/wuseguang/p/4072920.html1.语料预处理，生成双语分词之后的文件。2.词对齐。3.短语抽取。4.计算短语概率。5.最大熵调序。）->神经机器翻译...
复制链接

扫一扫

专栏目录