ChatGPT基础知识、处理流程和参数（1）

William3242

已于 2024-05-02 15:57:27 修改

阅读量355

点赞数 4

分类专栏： ChatGPT基础文章标签：深度学习人工智能 chatgpt

于 2024-05-02 15:56:44 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_50079897/article/details/138393097

版权

ChatGPT基础专栏收录该内容

1 篇文章 0 订阅

订阅专栏

tips:B站ChatGPT详细解释视频–笔记记录
ChatGPT详细解释视频

1.基本名词

标量：单个的数值，只有大小而没有方向
向量：一组有序的数值，表示某种量的大小和方向
张量：向量的泛化，多维数组，表示某种量的大小和方向
词向量：词的向量化，赋予一个词、字其一系列评分/取值，而多个词就组成了一个张量，其中GPT-3 175B 的词向量的长度为12288
Token：子词，可以共享单词之间的共同语义结构
对于中文来说，Token可以使词组、词、字、偏旁以及部首
超参数【事先设定的】、参数【训练过程自动习得】
GPT：迭代预测下一个词向量
transformer结构：Encoder–Decoder

更具体一点：

2.GPT总体结构

输入处理

在这里插入图片描述

解码器

可以看到GPT的解码器和transform模型结构相差一个解码注意力层
在这里插入图片描述

其中自注意力子层：1.捕捉输入序列的相互之间的依赖、相互之间的关系；2.捕捉全量的、长距离的输入序列的语义表示和语义依赖

前馈神经网络：捕捉输入序列的整体的、隐藏的、复杂的、组合的语义表示

自注意力子层

在这里插入图片描述

多头自回归自注意力机制

注意力机制：输入序列和输出序列之间的注意力。

自注意力机制：输入序列自身。

自回归/单向/因果：只能看到自己左边的字。

多头：分成多个头，分别取注意不同的语义表示。

自注意力头处理过程：

在这里插入图片描述

自注意力层剩余部分处理：

在这里插入图片描述

前馈神经网络子层

在这里插入图片描述

输出处理：

在这里插入图片描述

参数计算

在这里插入图片描述

关注

4
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

William3242 CSDN认证博客专家 CSDN认证企业博客

码龄4年

4: 原创

185万+: 周排名

21万+: 总排名

3631: 访问

: 等级

56: 积分

8: 粉丝

9: 获赞

2: 评论

19: 收藏

私信

关注

热门文章

分类专栏

ChatGPT基础 1篇

最新评论

蓝桥杯的考前突击（基础）
CSDN-Ada助手: 非常感谢您分享有关蓝桥杯的考前突击和温馨提醒，这对许多正在准备比赛的人来说肯定是非常有帮助的。希望您能继续分享更多关于计算机科学和编程的内容。除了您在摘要中提到的建议外，我还想补充一些知识，例如：数据结构、算法、编程语言和计算机网络等。这些都是在蓝桥杯竞赛中非常重要的领域，希望能够帮助到您和其他读者。再次感谢您的分享，期待您的下一篇博客。如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2 如果您持续创作，完成第三篇博客，并且质量分达到 80 分以上，在评论区就有机会获得红包奖励哦！
Acwing算法基础课第1-2章部分笔记
CSDN-Ada助手: 恭喜你写了第三篇博客，内容也很不错，对Acwing算法基础课的学习有很好的总结和笔记。建议你可以继续深入学习这门课程，也可以尝试结合实战问题写一些算法实现的文章，加深对算法知识的理解和应用。期待你的更多优秀文章。 CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3，我们会奖励持续创作和学习的博主，请看：https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply3

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。