昇思MindSpore技术公开课——第四课：GPT2

Lumos_yuan

已于 2024-01-23 18:36:59 修改

阅读量420

点赞数 9

文章标签：自然语言处理 llama

于 2024-01-23 18:35:07 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Sunshine_XX/article/details/135779940

版权

本文详细介绍了GPT-2模型的工作原理，包括LanguageModel预测、Transformer架构、自回归训练和GPU加速技术的应用。同时强调了数据预处理中的关键环节，如序列长度一致性及合适的裁剪策略。课程设计注重理论与实践结合，旨在提升学员的实际操作能力。

摘要由CSDN通过智能技术生成

1、学习总结

1.1Language Model

预测下一个单词的模型。

1.2GPT-2

在输入与输出之间加一个任务指令。

1.3GPT2 全链接层模块的实现

生成下三角矩阵，灰色部分待预测。

做完softmax之后，上三角的位置会全部变成 0。

self-attention之后还要加一层project层全连接层（ mindnlp.models.utils.utils.Conv1D )，就是对得到的矩阵再进行一次变换。

2、学习心得

GPT2的论文介绍了模型的基本结构和训练方法。GPT2是一个基于Transformer的编码器-解码器模型，采用了大量的并行计算和GPU加速技术进行训练。在训练过程中，模型通过自回归的方式生成目标序列，并使用监督学习和无监督学习相结合的方法进行优化。这种训练方式使得GPT2能够更好地理解和生成自然语言文本。

3、经验分享

在学习GPT-2之前，我建议深入了解Transformer模型和编码器-解码器结构的原理。这有助于更好地理解GPT-2的工作方式和优化方法。
在数据预处理阶段，最核心的挑战是如何对数据进行填充。在确保最大序列长度一致的情况下，我们不仅要对过长的训练样本进行裁剪，还要对不足长度的样本进行填充，以确保所有数据样本的长度一致。关于裁剪的方法多种多样，不同的裁剪策略可能会对模型的训练效果产生影响。为了更好地平衡信息保留，例如在课程中的摘要任务中，我们选择保留所有的摘要数据，而对原文数据进行裁剪。因此，选择合适的数据裁剪方案对于数据预处理至关重要。

4、课程反馈

课程不仅关注理论，还高度重视实际操作和动手能力。这种教学方法鼓励学员亲自动手，通过实践来巩固和加深对课程内容的理解；从课程大纲到具体内容，都显示出精心设计和组织。这种结构使得课程内容易于理解，有助于学员更好地吸收和记忆。

5、未来展望

独立完成文本生成任务。

关注

9
点赞
踩
6

收藏

觉得还不错? 一键收藏
1
评论
昇思MindSpore技术公开课——第四课：GPT2

预测下一个单词的模型。
复制链接

扫一扫

Lumos_yuan CSDN认证博客专家 CSDN认证企业博客

码龄5年

28: 原创

39万+: 周排名

4万+: 总排名

2万+: 访问

: 等级

707: 积分

300: 粉丝

420: 获赞

17: 评论

362: 收藏

私信

关注

热门文章

最新评论

求助！Jupyter notebook怎么这个样子？
Lumos_yuan: 版本问题，最新版就是这样，你可以换个版本试试。
求助！Jupyter notebook怎么这个样子？
zhangzhou996175364: 你解决了吗，我的也是这样
Lumos学习python第九课：VSCode+Anaconda
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/618428929。
Lumos学习王佩丰Excel第二讲：单元格格式设置
CSDN-Ada助手: 恭喜用户写了第20篇博客！学习王佩丰Excel第二讲的内容很实用，单元格格式设置对于提升工作效率非常重要。希望您能继续保持创作的热情，分享更多有价值的内容给大家。下一步可以考虑深入探讨Excel中其他功能或者分享一些实用的技巧，相信会受到更多读者的喜爱。期待您的下一篇作品！祝您创作顺利！
Lumos学习王佩丰Excel第一讲：认识Excel
CSDN-Ada助手: 恭喜用户第19篇博客的发布！学习王佩丰Excel系列文章一定会带给读者很多收获。建议在接下来的创作中，可以深入探讨Excel的实际运用场景，结合案例进行讲解，让读者更加直观地理解Excel的应用技巧。期待您的下一篇文章，继续加油！祝您创作顺利！

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。