seq2seq 对话，翻译

最新推荐文章于 2024-07-03 16:50:12 发布

xiao___qiao

最新推荐文章于 2024-07-03 16:50:12 发布

阅读量223

点赞数

分类专栏： NLP 文章标签：深度学习 lstm nlp

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_37074299/article/details/112718395

版权

NLP 专栏收录该内容

12 篇文章 2 订阅

订阅专栏

目录

1 目的和思想
2 模型原理
3 优化
4 seq2seq 总结
5 应用任务

1 目的和思想

seq2seq 模型的目的：通过一个序列得到另一个序列，例如：问答、翻译
seq2seq 的整体思想：利用了 LSTM
模型出自论文: Sequence to Sequence Learning with Neural Networks

2 模型原理

模型实现（基础模型）：

将输入的序列通过 encoder 编码为定长向量 c
再将 c 输入decoder 解码输出序列

在这里插入图片描述
左边是lstm作为encoder，右边是lstm作为decoder

训练时为监督
在这里插入图片描述
预测时为无监督

3 优化

在基础的seq2seq模型上，会存在几种问题需要解决：

输入的序列长度不定长，很难用 c 来表示，直接编译会导致梯度消失

3.1 Teacher Forceing

Teacher Forcing 用于训练阶段，是上一个神经元得出的结果不一定是正确的，会根据一定比例使用上个神经元输出的结果

3.2 Attention

在注意力机制下，decoder 的输入就不是固定的上下文向量 c 了，而是会根据当前翻译的信息，计算当前的 c

3.3 beam search

4 seq2seq 总结

seq2seq 能使用长度不同长度的输入和输出序列，可以适用很多任务

5 应用任务

文中应用任务：

对话系统
机器翻译
阅读理解

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
seq2seq 对话，翻译

目录1 目的和思想2 模型原理2.1 PV-DM（段落向量的分布式存储模型）2.2 PV-DBOW （段落向量的分布式单词包版本）3 doc2vec 总结4 应用任务1 目的和思想seq2seq模型的目的：创建文档向量表示seq2seq 的整体思想：在word2vec的基础上增加了可训练句子的矩阵seq2seq
复制链接

扫一扫

专栏目录

xiao___qiao CSDN认证博客专家 CSDN认证企业博客

码龄8年

31: 原创

15万+: 周排名

55万+: 总排名

1万+: 访问

: 等级

330: 积分

4: 粉丝

11: 获赞

16: 评论

56: 收藏

私信

关注

热门文章

分类专栏

java
深度学习 1篇
graph 5篇
NLP 12篇
常见问题 1篇
pytorch 9篇
机器学习 1篇

最新评论

GraphSage 图向量
自在飞花69: 请问这个模型可以通过python进行引用吗？求代码求论文名称。研究所用，十分感谢
RNN
不吃西红柿丶: 写得挺好，要持续稳定输出哦~
pytorch 安装
不吃西红柿丶: 非常有用，感谢大佬的整理，期待后续大作
tensorboard 使用
不吃西红柿丶: 大佬的文章让我受益匪浅，如痴如醉，以后的日子还希望能够得到大佬的谆谆指指点点!
plt、nn 使用
不吃西红柿丶: 大佬的文章让我受益匪浅，如痴如醉，以后的日子还希望能够得到大佬的谆谆指指点点!

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。