encoder和decoder结构

你再翻一页就好了

于 2024-08-18 11:22:28 发布

阅读量131

点赞数 1

文章标签： encoder decoder graph structure 深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41542141/article/details/141297241

版权

1. 编码器（Encoder）：

编码器处理输入数据（例如，句子中的词序列），并将其压缩成一个固定大小的上下文向量或一系列上下文向量。
这一部分通常由多层递归神经网络（RNNs）、长短期记忆网络（LSTMs）、门控循环单元（GRUs）或最近的Transformer网络组成。
编码器逐步读取输入序列，并在每一步更新其隐藏状态。最终的隐藏状态或一系列隐藏状态就包含了输入序列的信息。

2. 上下文向量（Context Vector）：

上下文向量是输入序列的压缩表示。在传统的编码器-解码器模型中，这是一个单一的向量，但在更先进的模型如基于注意力机制的模型中，它可以是一系列向量。
该向量作为输入数据的摘要，解码器将使用它来生成输出。

3. 解码器（Decoder）：

解码器接收编码器生成的上下文向量（或多个向量），逐步生成输出序列。
与编码器类似，解码器可以由RNNs、LSTMs、GRUs或Transformers组成。
解码器在生成输出序列的每一个标记时，会参考上下文向量和已生成的标记。
在机器翻译等任务中，解码器一次预测一个词，并将其输出反馈给自身，以预测下一个词。

注意力机制（Attention Mechanism）（可选但常用）：

在许多现代的编码器-解码器架构中，使用注意力机制使解码器在生成每个输出标记时可以关注输入序列的不同部分。
通过注意力机制，解码器可以访问编码器生成的整个隐藏状态序列，并在每个解码步骤中对它们进行不同的加权。

你再翻一页就好了

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
encoder和decoder结构

1. 编码器（Encoder）：编码器处理输入数据（例如，句子中的词序列），并将其压缩成一个固定大小的上下文向量或一系列上下文向量。这一部分通常由多层递归神经网络（RNNs）、长短期记忆网络（LSTMs）、门控循环单元（GRUs）或最近的Transformer网络组成。编码器逐步读取输入序列，并在每一步更新其隐藏状态。最终的隐藏状态或一系列隐藏状态就包含了输入序列的信息。2. 上下文向量（Context Vector）：上下文向量是输入序列的压缩表示。在传统的编码器-解码器模型中，这是一个单
复制链接

扫一扫

你再翻一页就好了 CSDN认证博客专家 CSDN认证企业博客

码龄7年

39: 原创

3万+: 周排名

4万+: 总排名

4万+: 访问

: 等级

535: 积分

30: 粉丝

46: 获赞

4: 评论

106: 收藏

私信

关注

热门文章

分类专栏

最新评论

python 基本数据处理
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用更多的站内链接；(2)提升标题与正文的相关性。
centos7版本运行python机器学习模型
你再翻一页就好了: batch_size 为了处理批量数据；num_channels 通道数；如果输入张量为X 形状为 (10, 5, 100)，就是对10*5个信号长度为100的信号进行并行处理。实际就是一维信号的并行处理
centos7版本运行python机器学习模型
聪聪0620: 请问 DWT1DForward这个函数是处理一维信号的小波变换吗，如果是为啥输入的必须是三维
Python数据类型处理
wertyu159: 博主的技术面很广哦，小菜鸟求带，可以加你微信和您交流吗

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。