大模型基础理论梳理

沛槐-艺锦

于 2024-02-05 16:33:56 发布

阅读量1.1k

点赞数 21

文章标签： github 开源语言模型

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_63221910/article/details/136043934

版权

项目地址：github.com

第一章：引言

一、什么是大语言模型

语言模型可以被看作一个预测的机器，他根据已知的单词来预测下一个单词出现的概率。这个预测基于大量文本数据的学习，使得模型能够理解哪些单词组合在一起有意义

想象一下，如果我们有一个包含‘ate’、‘ball’、‘cheese’、‘mouse’、‘the’的词汇表。语言模型的任务是判断不同的单词组合或者序列出现的可能性有多大，例如，对于句子‘the mouse ate the chesse’,模型可能会认为这是一个很有可能出现的序列，因此会给它一个较高的概率值。相反，对于‘chesse ate the mouse’,模型会认为这个序列不太可能出现，因此会给它一个较低的概率值

这个过程听起来简单，但实际上很复杂，语言模型不仅需要理解词汇的字面意思，还需要理解他们如何结合在一起形成有意义的句子，这就意味着模型必须具有对语言的深刻理解，包括语法规则和单词的常见用法。

此外，语言模型还可以用于生成文本。基于已有的词汇以及语法规则，模型可以创建新的句子。这通常会通过从模型预测的概率分布中选择单词来完成。简单来说，就像是抽奖：有些单词被抽中的机会更大，因为模型认为他们在特定的上下文中出现的可能性会更高

生成‘最佳’序列：在某种情况下，我们不仅想要任何一个概率上可行的序列，而是想要最能代表某个特定风格或者内容的‘最佳’序列。为此，我们可以采用各种技术来调整采样过程，使得生成的文本更加符合特定的要求或者标准

总之，语言模型在生成任务中的应用相当于一个能够根据概率创造新文本的过程，这个过程既可以是完全随机的，也可以是受控的，取决于我们对生成文本的具体要求。通过这种方式，语言模型可以被采用创造各种风格和类型的文本，从诗歌到故事，甚至是新闻报道

二、自回归语言模型

基本原理

链式法则：自回归模型使用概率的链式法则来表示一个序列的联合概率分布。意味着序列中的每个单词出现的概率都依赖于它之前所有单词的联

最低0.47元/天解锁文章

博客等级

码龄4年

17
原创

277
点赞

229
收藏

226
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

最新评论

Sora原理与技术（二）---机器学习里的“集中注意力”：一步步了解注意力机制
CSDN-Ada助手: 恭喜您撰写了第12篇博客，深入探讨了Sora原理与技术中的“集中注意力”在机器学习中的应用。这篇文章对注意力机制进行了逐步解析，让读者更加深入地了解相关概念。我希望您能继续保持创作热情，探索更多前沿技术，并结合实际案例展开讨论，这样读者能更好地理解和应用所学知识。期待您未来更多精彩的文章！
数据学习笔记（一）
CSDN-Ada助手: 恭喜您写下了第11篇博客《数据学习笔记（一）》，持续创作不易，您的努力和热情让人钦佩。接下来，可以考虑在笔记中加入自己的理解和应用场景，或者分享一些实际案例，让读者更容易理解和接受。期待您更多精彩的创作！祝您进步顺利！
Sora原理与技术（一）
CSDN-Ada助手: 恭喜用户写了第10篇博客，内容涉及Sora原理与技术，对于这一主题的深入探讨让读者受益匪浅。希望用户在未来的创作中，可以继续分享更多关于Sora原理与技术的知识，或是拓展相关主题，让我们能够更全面地了解这一领域。期待用户的下一篇作品，也希望用户能够保持谦虚的态度，不断进步，为读者带来更好的内容。
大模型基础理论梳理
CSDN-Ada助手: 恭喜您写了第9篇博客！标题“大模型基础理论梳理”非常吸引人。我对您持续创作的努力表示赞赏。在这篇博客中，您对大模型的基础理论进行了梳理，这无疑为读者提供了宝贵的知识。不过，如果可能的话，我想建议您在接下来的创作中，可以进一步扩展一些实际案例或者应用场景，这样读者可以更好地理解大模型的实际应用。再次恭喜您，并期待您未来更多精彩的创作！
Datawhale --学习git 第四节
CSDN-Ada助手: 恭喜你写了第8篇博客，学习git 第四节！感谢你对Datawhale社区的贡献，帮助更多人学习git知识。接下来，我建议你可以考虑分享一些git在实际项目中的应用经验，或者结合其他工具和技术来深入探讨git的应用场景。希望你能继续保持创作的热情，期待你更多的精彩内容！

最新文章

目录

展开全部

收起

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。