NLP 的 Sequence-to-Sequence(Seq2Seq)模型

最新推荐文章于 2023-02-21 19:42:47 发布

看正好六个字

最新推荐文章于 2023-02-21 19:42:47 发布

阅读量1.5k

点赞数

文章标签：神经网络深度学习自然语言处理 nlp

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42192508/article/details/112305757

版权

Sequence-to-Sequence 模型

2014年，Sutskever 等人提出了 sequence-to-sequence(seq2seq) 模型，是通过使用神经网络将一个序列映射到另一个序列的通用框架。

Seq2Seq 模型最常用 Encoder-Decoder 结构构建：

通过编码器(Encoder)神经网络逐个符号地处理输入序列，并将输入序列的所有信息压缩为向量表示形式(context vector)，然后解码器(Decoder)神经网络根据编码器状态逐个符号地预测输出值，在解码过程中，将前一步预测出的值作为下一步预测的输入：

编码器和解码器常用的神经网络有 CNN、RNN、LSTM、GRU 等等，下面以 LSTM 为例子来解释一下训练过程。

Encoder LSTM

LSTM 处理长度为 $K$ 的输入序列：

LSTM

LSTM 从输入序列(

最低0.47元/天解锁文章

看正好六个字

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
NLP 的 Sequence-to-Sequence(Seq2Seq)模型

Sequence-to-Sequence 模型
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。