Transformer的Decoder的输入输出

最新推荐文章于 2024-02-16 00:41:37 发布

Replete

最新推荐文章于 2024-02-16 00:41:37 发布

阅读量1.4k

点赞数 3

文章标签： transformer 深度学习人工智能机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_38906715/article/details/125675878

版权

以翻译为例：

输入：我爱中国
输出： I Love China

因为输入（“我爱中国”）在Encoder中进行了编码，这里我们具体讨论Decoder的操作，也就是如何得到输出（“L Love China”）的过程。

中间输入:（“我爱中国”）在Encoder中编码结果，（我爱中国）Encoder Embedding

Decoder执行步骤
Time Step 1

- 初始输入：起始符</s> + Positional Encoding（位置编码）
- 中间输入：（我爱中国）Encoder Embedding
- 最终输出：产生预测“I”

Time Step 2

- 初始输入：起始符</s> + “I”+ Positonal Encoding
- 中间输入：（我爱中国）Encoder Embedding
- 最终输出：产生预测“Love”

Time Step 3

- 初始输入：起始符</s> + “I”+ “Love”+ Positonal Encoding
- 中间输入：（我爱中国）Encoder Embedding
- 最终输出：产生预测“China

作者：既安
链接：https://www.zhihu.com/question/337886108/answer/893002189
来源：知乎
著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

在Decode的Multi-head attention模块中，由中间输入M（我爱中国）Encoder Embedding生成(K,V),由初始输入生成Q

关注

3
点赞
踩
6

收藏

觉得还不错? 一键收藏
1
评论
Transformer的Decoder的输入输出

以翻译为例：输入：我爱中国输出： I Love China因为输入（“我爱中国”）在Encoder中进行了编码，这里我们具体讨论Decoder的操作，也就是如何得到输出（“L Love China”）的过程。中间输入:（“我爱中国”）在Encoder中编码结果，（我爱中国）Encoder EmbeddingDecoder执行步骤Time Step 1初始输入：起始符</s> + ...
复制链接

扫一扫

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。