《这就是ChatGPT》第三章 - 概率从何而来——读书笔记

猿类崛起@

已于 2024-07-09 14:12:46 修改

阅读量955

点赞数 15

文章标签： chatgpt AIGC 人工智能机器学习神经网络自然语言处理

于 2024-04-28 17:48:46 首次发布

本文链接：https://blog.csdn.net/2401_84495872/article/details/138284592

版权

本文详细探讨了ChatGPT中的概率估计方法，如n-gram模型在预测文本中的应用，以及神经网络权重的训练过程。通过实例和案例分析，揭示了大模型AI学习概率分布并生成文本的能力。文章还涵盖了不同阶段的学习路径，从基础应用到模型训练和商业闭环，强调了持续学习在AI领域的价值。

摘要由CSDN通过智能技术生成

读书笔记：《这就是ChatGPT》第三章 - 概率从何而来

在这里插入图片描述

核心概念：

概率估计：通过分析大量文本数据，估算出单词或字母出现的概率。
n-gram模型：利用前n-1个词来预测下一个词出现的概率。
模型参数：神经网络中的权重，通过训练来优化，以最小化预测误差。

案例分析：

字母概率估计案例：
- 数据来源：维基百科“cats”和“dogs”条目。
- 方法：统计各个字母的出现次数。
- 结果：得出字母出现频率的相对比例，如字母“e”在英语中的出现概率。
单词概率估计案例：
- 挑战：英语中大约有50000个常用词，可能的二元词组合数量巨大，无法直接从文本估计所有概率。
- 解决方案：建立模型来估计序列出现的概率，即使这些序列在文本中未明确出现。
n-gram模型应用案例：
- 例子：使用二元字母（bigram）概率生成文本，关注两个字母的组合。
- 结果：生成的文本中包含一些“实际的词”，显示了模型的有效性。
模型训练数据：
- 来源：互联网上的网页、电子书等。
- 规模：数十亿个网页，词数达到万亿级别。

数据示例：

英语语言中字母的出现频率（百分比）：
- e: 12.7%
- t: 9.06%
- a: 8.17%
- o: 7.51%
- i: 6.97%

模型训练：

训练过程：提供样例，调整网络权重，最小化误差。
损失函数：计算得到的值与真实值之间的差异。
优化方法：使用梯度下降等技术找到损失函数的最小值。

模型的局限性：

尽管ChatGPT能够生成看似合理的文本，但它仍然受限于训练数据和算法的局限性。

结论：

ChatGPT的成功展示了从大规模数据中学习概率分布的强大能力，以及这些概率分布在生成文本中的应用潜力。

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述