Transformer架构解析——认识Transformer架构

嗜血小天鹅

已于 2024-01-30 10:29:10 修改

阅读量1.5k

点赞数 2

分类专栏：深度学习文章标签： transformer 深度学习

于 2023-11-12 16:32:56 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zane96/article/details/134361329

版权

深度学习专栏收录该内容

1 篇文章 0 订阅

订阅专栏

一、Transformer架构解析

1.Transformer总体架构可分为四部分

输入部分、输出部分、编码器部分、解码器部分。

如图所示：左边为编码器部分，右边为解码器部分。

1.1输入部分：

源文本嵌入层及其位置编码器
目标文本嵌入层及其位置编码器

源文本先进入一个Embedding（文本嵌入层）进行一个位置编码器的处理。

目标文本进入一个Embedding进行一个位置编码器的处理。

1.2输出部分：

线性层
softmax层

1.3编码器部分：

由N个编码器层堆叠而成
每个编码器层由两个子层连接结构组成
第一个子层连接结构包括一个多头自注意力子层和规范化层以及一个残差连接
第二个子层连接结构包括一个前馈全连接子层和规范化层以及一个残差连接

N为超参数，由程序员指定

残差链接：可以跨层向上传递信息

1.4解码器部分

由N个编码器层堆叠而成
每个编码器层由三个子层连接结构组成
第一个子层连接结构包括一个多头自注意力子层（加了一个mask掩码）和规范化层以及一个残差连接
第二个子层连接结构包括一个多头注意力子和规范化层以及一个残差连接
第二个子层连接结构包括一个前馈全连接子层和规范化层以及一个残差连接

小节总结：

学习Transformer模型的作用：
基于seq2seq架构的transformer模型可以完成NLP领域研究的典型任务如机器翻译文本生成等同时又可以构建预训练语言模型，用于不同任务的迁移学习

嗜血小天鹅

关注

2
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
Transformer架构解析——认识Transformer架构

Transformer模型的总体架构——输入部分、输出部分、编码器部分、解码器部分
复制链接

扫一扫

专栏目录

嗜血小天鹅 CSDN认证博客专家 CSDN认证企业博客

码龄3年

广州应用科技学院

9: 原创

149万+: 周排名

18万+: 总排名

3362: 访问

: 等级

116: 积分

12: 粉丝

25: 获赞

3: 评论

19: 收藏

私信

关注

热门文章

分类专栏

最新评论

STM32F103——串口收发消息
CSDN-Ada助手: 恭喜您写了第8篇博客，题为“STM32F103——串口收发消息”。看到您持续创作的努力，我感到非常高兴。您在这篇博客中讨论了串口收发消息的问题，这对于学习STM32F103来说是一个非常重要的主题。我希望您能继续保持写作的热情，并分享更多关于STM32F103的知识和经验。下一步，我建议您可以尝试探索一些更深入的应用场景，或者与其他微控制器相比较，这样可以让读者更全面地了解STM32F103的优势和特点。谢谢您的分享，期待您的下一篇博客！
STM32F103入门——点亮LED灯
CSDN-Ada助手: 恭喜您写了第9篇博客，标题为“STM32F103入门——点亮LED灯”！您的持续创作真是令人钦佩。这篇博客对于入门者来说非常有用，因为点亮LED灯是学习STM32F103的重要一步。我希望您能继续分享关于STM32F103的知识，比如如何控制其他外设，或者进行更复杂的任务。谦虚地说，您的经验将对读者们的学习和实践非常有帮助。期待您的下一篇创作！
STM32 HAL库开发——NVIC的使用
CSDN-Ada助手: 恭喜您撰写了第5篇博客，题为“STM32 HAL库开发——NVIC的使用”。看到您持续创作并分享STM32 HAL库开发的经验，我感到非常高兴。您对NVIC的使用进行了介绍，这对于初学者来说是非常有帮助的。对于下一步的创作建议，我谦虚地建议您可以进一步探索STM32 HAL库的其他功能或者深入研究NVIC的更多应用场景。期待您未来更多的精彩博客！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。