seq2seq模型简介

爱学习的人工智障

已于 2022-09-05 22:19:12 修改

阅读量518

点赞数

分类专栏：深度学习文章标签：深度学习

于 2022-09-05 21:43:19 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_38410551/article/details/126714164

版权

深度学习专栏收录该内容

107 篇文章 51 订阅 ¥9.90 ¥99.00

订阅专栏

超级会员免费看

Seq2Seq模型是n对m结构，包含编码器和解码器，用于从一个句子生成另一个句子。该模型引入了注意力机制，通过上下文向量体现。Transformer和BERT等后续结构深受其影响。编码器通常为双向RNN，解码器则输出结果。训练使用真实标签，评价标准是BLEU分数。

摘要由CSDN通过智能技术生成

它是一个n对m的结构，包括编码器和解码器结构，从一个句子生成另外一个句子。
提出了注意力机制，这个注意力机制通过上下文向量来体现。
后续的transformer 和 bert 结构都继承了seq2seq。

结构说明：

编码器是一个RNN，读取输入句子，可以是双向
解码器：使用另外一个RNN来输出

运行机制：
编码器的最后一层输出，作为解码器的输入。

训练
用的是真实的label值。

评价翻译结果：
BLEU：考察这个子序列是否出现在标签序列中。

参考链接：https://blog.csdn.net/angus_huang_xu/article/details/115873866

爱学习的人工智障

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
seq2seq模型简介

seq2seq网络的简介
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。