PyTorch中实现Transformer模型

最新推荐文章于 2024-07-10 20:26:14 发布

seelylin

最新推荐文章于 2024-07-10 20:26:14 发布

阅读量189

点赞数 2

文章标签： pytorch transformer 人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/linklk123/article/details/135978310

版权

关于Transformer原理与论文的介绍：详细了解Transformer：Attention Is All You Need

对于论文给出的模型架构，使用 PyTorch 分别实现各个部分。

引入的相关库函数：

	`import copy`
	`import torch`
	`import math`
	`from torch import nn`
	`from torch.nn.functional import log_softmax`

	`# module: 需要深拷贝的模块`
	`# n: 拷贝的次数`
	`# return: 深拷贝后的模块列表`
	`def clones(module, n: int) -> list:`
	`return [copy.deepcopy(module) for _ in range(n)]`

1. 编码器与解码器堆叠

Encoder 编码器

编码器由 N 个相同的编码层堆叠而成，每个编码层含两个子层：多头注意力层和前馈网络层。每个子层后跟着一层，用于残差连接与标准化。

Add & Norm 残差连接和标准化

对于上一层的结果：SubLayer(�)与输出上一层的变量：�做残差连接并进行标准化：LayerNorm(�+Sublayer(�))。

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
PyTorch中实现Transformer模型

对于论文给出的模型架构，使用 PyTorch 分别实现各个部分。
复制链接

扫一扫

seelylin CSDN认证博客专家 CSDN认证企业博客

码龄9年

1: 原创

77万+: 周排名

29万+: 总排名

189: 访问

: 等级

12: 积分

6: 粉丝

2: 获赞

0: 评论

0: 收藏

私信

关注

热门文章

PyTorch中实现Transformer模型 189

最新评论

PyTorch中实现Transformer模型
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python

大家在看

Go 语言channel的应用场景及使用技巧 546

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。