seq2seq概述

最新推荐文章于 2022-03-28 23:25:52 发布

ZhangDanzhu

最新推荐文章于 2022-03-28 23:25:52 发布

阅读量1.4k

点赞数 1

分类专栏：人工智能相关 how-to-use 文章标签： seq2seq

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ZhangDanzhu/article/details/93468111

版权

how-to-use 同时被 2 个专栏收录

14 篇文章 0 订阅

订阅专栏

人工智能相关

3 篇文章 0 订阅

订阅专栏

输入：

序列

输出：

序列

应用场景：

机器翻译
聊天机器人
文本摘要生成
图片描述生成
诗词生成
故事风格改写
代码补全？？

主要思路：

通过一个深度神经网络模型（常用LSTM）将输入序列映射为输出序列
编码输入（encoder）与解码输出(decoder)两个环节，中间状态向量C

Seq2Seq的实现程序设计好之后的输入序列和输出序列长度是不可变的(?)
在这里插入图片描述

解码部分

Seq2Seq的核心部分是其解码部分，大部分改进基于此：

greedy search：基础解码方法
beam search：对greedy search的改进
attention：它的引入使得解码时，每一步可以有针对地关注与当前有关的编码结果，从而减小了编码器输出表示的学习难度，也更容易学到长期的依赖关系。
memory network：从外部获取知识。
其他方法：

堆叠多层RNN的Decoder
增加dropout机制
与Encoder建立残差连接

涉及其他知识点：

RNN
LSTM、GRU
预处理相关：One-hot，embedding降维

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。