pytorch-learning-04

最新推荐文章于 2024-04-25 09:34:40 发布

leonhoou

最新推荐文章于 2024-04-25 09:34:40 发布

阅读量328

点赞数

分类专栏： MachineLearning

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hliyang/article/details/104399185

版权

MachineLearning 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

机器翻译

主要特征：输出是单词序列而不是单个单词。输出序列的长度可能与源序列的长度不同。

流程：

数据预处理
分词
建立词典
建立模型

Encoder-Decoder模型：
一种应用于seq2seq问题的模型，所谓编码，就是将输入序列转化成一个固定长度的向量；解码，就是将之前生成的固定向量再转化成输出序列。在具体实现的时候，编码器和解码器不是固定的,可选的有CNN/RNN/BiRNN/GRU/LSTM等等，可以自由组合。
缺点：
编码和解码之间的唯一联系就是一个固定长度的语义向量C。也就是说，编码器要将整个序列的信息压缩进一个固定长度的向量中去。但是这样做有两个弊端，一是语义向量无法完全表示整个序列的信息；还有就是先输入的内容携带的信息会被后输入的信息稀释掉，或者说，被覆盖了。输入序列越长，这个现象就越严重。这就使得在解码的时候一开始就没有获得输入序列足够的信息，那么解码的准确度自然也就要打个折扣了。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。