【Transformer】学习过程记录

最新推荐文章于 2024-05-15 00:15:13 发布

不会数分的程序员不是好会计

最新推荐文章于 2024-05-15 00:15:13 发布

阅读量150

点赞数

文章标签： transformer 学习深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_50006912/article/details/130971259

版权

Transformer

算法结构
代码解读

论文来源：Attention Is All You Need
程序源码来源：github中的demo

算法结构

根据论文的给出的图片，我们不难模仿着画出算法的简要结构。

对于更加细致的各个模块功能以及上面给出demo的数据在模型中shape的变化过程，还可以看下面这张图：

代码解读

拿到这个demo后，首先确定一下这个程序的输入是什么，输出是什么，要解决的是什么问题。

通过一步步的debug代码调试，不难发现，输入是[2, 3, 4, 5, 2, 4, 9, 7, 6, 10, 5]这样的整数列表。而且这里的列表长度默认是15（训练数据encoder输入是15，decoder输入是14），列表中的值位于[2, 11)之间。这里的范围与长度都是有一定的意义的，我们把每一个列表看成一个句子，每个整数值当作一个字，则这里15表示一个句子的长度为15，而11的限制暗示这些句子中会有11种不同的字。
这个demo程序的任务就是要通过[2, 3, 4, 5, 2, 4, 9, 7, 6, 10, 5]这样的输入，推出[ 3, 4, 5, 2, 4, 9, 7, 6, 10, 5]这样的输出，更直观的来说就是略去最开头的字符。输入数据shape(15)，而输出数据shape(14)。

参考博客与网络资源：
[1]: Transformer代码完全解读(附有可实验的完整训练推理程序)
[2]: Transformer算法完全解读
[3]: NLP基础知识点：BLEU（及Python代码实现)
[4]: 十分钟读懂Beam Search 1：基础

不会数分的程序员不是好会计

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
【Transformer】学习过程记录

transformer学习经历，包含参考博客，输入输出数据解读，以及自制模型流程图
复制链接

扫一扫

不会数分的程序员不是好会计 CSDN认证博客专家 CSDN认证企业博客

码龄4年

11: 原创

117万+: 周排名

5万+: 总排名

4万+: 访问

: 等级

425: 积分

199: 粉丝

127: 获赞

199: 评论

817: 收藏

私信

关注

热门文章

最新评论

【Yolov5】Yolov5同时添加ASFF与新的检测层
不会数分的程序员不是好会计: 可以看看下面，有人问过这个问题
【Yolov5】Yolov5同时添加ASFF与新的检测层
Include82: 你好这个错误你解决了吗，我也出现这个错误了
【Yolov5】Yolov5同时添加ASFF与新的检测层
Include82: 你好，这个错误你解决了吗，我也是这个错误
【Yolov5】Yolov5同时添加ASFF与新的检测层
Include82: Traceback (most recent call last): File "E:\shenduxuexi\biaozhi\yolov5-CCTSDB\models\yolo.py", line 335, in <module> model = Model(opt.cfg).to(device) File "E:\shenduxuexi\biaozhi\yolov5-CCTSDB\models\yolo.py", line 123, in __init__ self.model, self.save = parse_model(deepcopy(self.yaml), ch=[ch]) # model, savelist File "E:\shenduxuexi\biaozhi\yolov5-CCTSDB\models\yolo.py", line 308, in parse_model c2 = ch[f] TypeError: list indices must be integers or slices, not list出现了这个错误，怎么解决呢
【ubuntu】重装ubuntu系统，离线安装gcc和make
不会数分的程序员不是好会计: 有报错吗，报错信息是什么

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。