1.机器翻译及相关技术
机器翻译(MT):将一段文本从一种语言自动翻译为另一种语言,用神经网络解决这个问题通常称为神经机器翻译(NMT)。 主要特征:输出是单词序列而不是单个单词。 输出序列的长度可能与源序列的长度不同。
主要步骤:
1. 数据预处理
将数据集清洗、转化为神经网络的输入minbatch
2.分词
字符串—单词组成的列表
3.建立词典
单词组成的列表—单词id组成的列表
Encoder-Decoder与Seqtoseq模型
当输入和输出都是不定长序列时,我们可以使用编码器—解码器(encoder-decoder)或者seq2seq模型。两个模型本质上都用到了两个循环神经网络,分别叫做编码器和解码器。编码器用来分析输入序列,解码器用来生成输出序列。
易错习题:
1.
选项4错误的原因为:单词转化为词向量是模型结构的一部分,词向量层一般作为网络的第一层。
2.注意力机制与Seq2seq模型
super()的用法