transformer(解码器及之后)

最新推荐文章于 2023-11-14 16:40:21 发布

LR_WZUT

最新推荐文章于 2023-11-14 16:40:21 发布

阅读量169

点赞数

文章标签： transformer 深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/LR_WZUT/article/details/131806192

版权

生成器类的代码实现：

知识点1：这里其实就是一个linear再加上一个F.log_softmax()在维度为负一上的变换。目的就是改变向量维度。没什么新奇的内容。

知识点2：import torch.nn.functional

模型基本测试训练模型

第一步：构建数据集生成器

1.导入工具包Batch，它能够对原始样本数据生成对应批次的掩码张量。

from pyitcast.transformer_utils import Batch

2.需要的参数有V，用来给random.randint生成batch大小，10维度的数据集。

第二个参数是batch

即一次传入多少数据量。

第三个参数是num_batch，要进行多少轮才会完成数据，也就是num_batch*batch量就是总数据量。

3.构建tensor，用torch.from_numpy(),生成一到V的矩阵。

4.将第一列作为起始列变成全一，用切片操作。data [:,0] = 1。

5.传成source = variable(data,require_grad=Flase)

targert = Variable(data,require_grad=Flase)这里都要构建一个Variable,来装这些数据。

同时要将参数更新关掉。因为只是一个copy任务。

6.使用yield Batch(source,target)将数据生成器导出，生成的是封装好的迭代器。

使用transformer构建语言模型

知识点1：torch.narrow

1. 类似切片操作，当（0，）表示行上，（1，）表示列上。

2.0是行，1是列。

3.在行上是闭开区间，在列上是闭闭区间。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
transformer(解码器及之后)

知识点1：这里其实就是一个linear再加上一个F.log_softmax()在维度为负一上的变换。第三个参数是num_batch，要进行多少轮才会完成数据，也就是num_batch*batch量就是总数据量。6.使用yield Batch(source,target)将数据生成器导出，生成的是封装好的迭代器。2.需要的参数有V，用来给random.randint生成batch大小，10维度的数据集。1. 类似切片操作，当（0，）表示行上，（1，）表示列上。3.在行上是闭开区间，在列上是闭闭区间。
复制链接

扫一扫

LR_WZUT CSDN认证博客专家 CSDN认证企业博客

码龄2年

3: 原创

171万+: 周排名

32万+: 总排名

351: 访问

: 等级

35: 积分

1: 粉丝

0: 获赞

2: 评论

0: 收藏

私信

关注

热门文章

最新评论

transformer笔记（编码器之前）
CSDN-Ada助手: 这是一篇很有深度的博客，你对transformer的理解非常透彻。从标题和摘要中可以看出你对编码器的前置操作有很深入的研究。非常鼓励你继续写下去，分享更多关于transformer的知识。除了你提到的transpose和mask的应用，还有一些与该博文相关的扩展知识和技能可以进一步探索。例如，你可以介绍一下transformer模型中的注意力机制，以及如何通过编码器和解码器实现序列到序列的翻译任务。另外，你还可以讨论一下transformer模型在自然语言处理领域的其他应用，例如情感分析、文本生成等。总而言之，期待你在未来的博客中继续分享更多关于transformer的知识，同时也希望你能够扩展讨论一些与该模型相关的其他领域和技术。谦虚地说，这将为读者提供更全面的视角和深入的理解。加油！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
struct 的嵌套
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加条理清晰的目录；(2)使用标准目录；(3)增加除了各种控件外，文章正文的字数。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。