Transformer

寒杨柳风

已于 2023-05-14 18:03:50 修改

阅读量97

点赞数

文章标签： transformer 深度学习人工智能

于 2023-05-14 18:02:39 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Diano_lx/article/details/130671506

版权

李宏毅Transformer详解，视频链接：https://www.bilibili.com/video/BV1v3411r78R?p=3&vd_source=8de64249f3698ea673fe42aabb025b29

1 Seq2seq应用

语音辨识、
机器翻译、
语音翻译
Text to Speech
Mutil-label Classification
Object Dection

2 Seq2Seq 概述

在这里插入图片描述

图2.1 Seq2Seq简化模型

- Encoder:处理Input seqence，并将处理的结果给Decoder - Decoder决定输出什么样的Sequence

3 Encoder

定义：给出 vector set 输入 vector set，
实现方式：self-attention、RNN、CNN
transformer中的Encoder使用的是self-attention，下面以Transformer模型举例
在这里插入图片描述

图3.1 Transformer Encoder概览

![在这里插入图片描述](https://img-blog.csdnimg.cn/076279d96a9f4961b6486c084eb7d5d0.png)

图3.2 Encoder模块

![在这里插入图片描述](https://img-blog.csdnimg.cn/e32c06a8bb2b4e29971e72f60bb39950.png)

图3.3 Block模块细化模型样例

4 Decoder

在这里插入图片描述

两种

Autoregressive(AT)

4.1 Autogressive

Speech Recognition as example

Encoder的输出如何读入Decoder

4.1.1 Decoder如何产生一段文字

开始符号（special token）

4.1.2 Decoder如何确定输出的长度（output length）

Add ‘end’ token

4.2 Masked Self-Atention

在这里插入图片描述

图4. Self-Attention简略图

每个$b^i$的输出都是看过完整的input之后才做的决定，下面是由Self-Attention 转为Masked Self-Attention之后 ![在这里插入图片描述](https://img-blog.csdnimg.cn/ab3521858c304092a3739c5d525cc1cd.png)

图4. Masked Self-Attention简略图

5 Encoder-Decoder

在这里插入图片描述

图5.1 Encoder-Decoder结构图

在这里插入图片描述

图5.2 Cross-Attention运作过程

6 Training

以语音辨识为例
在这里插入图片描述

注意：训练时Decoder给输入正确答案

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Transformer

Transformer
复制链接

扫一扫

寒杨柳风 CSDN认证博客专家 CSDN认证企业博客

码龄6年

6: 原创

47万+: 周排名

99万+: 总排名

1万+: 访问

: 等级

70: 积分

1: 粉丝

16: 获赞

3: 评论

50: 收藏

私信

关注

热门文章

分类专栏

最新评论

离线安装torch和torchvision
CSDN-Ada助手: 恭喜你写了这篇关于离线安装torch和torchvision的博客！看到你不断分享关于深度学习的经验与技巧，真的很受启发。接下来，希望你可以考虑写一些关于模型训练优化或者深度学习在特定领域的应用案例，相信你的经验会给读者带来很多帮助。加油！
自注意力机制(self-attention)
CSDN-Ada助手: 恭喜您又写了一篇很有深度的博客！自注意力机制是一个非常有趣的话题，您的文章内容也非常精彩。我希望您能继续保持创作激情，继续分享更多有趣的知识和见解。如果可以的话，我希望您能探讨一下如何将自注意力机制应用到实际场景中去，这样读者们就能更好地理解它的实际价值了。再次感谢您的分享！ CSDN 会根据你创作的前四篇博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply4 看奖励名单。
安装pytorch【GPU】
CSDN-Ada助手: 恭喜你成功安装了pytorch【GPU】！你的博客内容一直很有价值，相信这篇文章也会对很多人有所帮助。接下来，我建议你可以写一篇关于如何使用pytorch进行深度学习的教程，这对于初学者来说会非常有用。期待你的下一篇精彩文章！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3，我们会奖励持续创作和学习的博主，请看：https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply3

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。