问题:机器翻译从英文翻译为中文,遇到输入和输出字符数不相等问题。
如:I am Chinese 译为 我是中国人
输入3个字符串,输出5个字符串 不等长问题
解决办法:Encoder-Decoder机制
将输入字符先放Encoder(循环神经网络),生成输入字符的语义编码,再将语义编码作为Decoder输入(生成式循环神经网络)。
因此解决不等长问题。
应用:机器翻译 sequence to sequence
具体模型:
注意:先将输入由id转换为词嵌入(embedding),再输入到循环神经网络中。