大规模语言模型理论基础笔记-引言

最新推荐文章于 2024-10-08 16:27:32 发布

何草不玄丶

最新推荐文章于 2024-10-08 16:27:32 发布

阅读量102

点赞数

文章标签：语言模型笔记人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_47637467/article/details/134939483

版权

引言

语言模型定义

Language Model 是一种对token序列的概率分布，对于一个序列p(x1,…,xL)，语言模型会为其分配一个概率p，这个分配概率的能力就是语言模型的能力。这种能力体现了语言模型的语法能力，世界知识等能力。

自回归语言模型

自回归语言模型的特点是它可以利用例如前馈神经网络等方法有效计算出每个条件概率分布p(xi|x1:i-1)，根据这一系列概率分布我们就可以依次生成下一个token的条件概率分布

这里T是控制随机性的温度参数，当

T=0时，每个位置上只选择概率最高的token

T=1时，完全normally采样

T=无限大时，则是从整个词汇表中进行均匀采样

为了保证调整T时，概率和为1，一般采用重新标准化分布来解决这个问题。（softmax?）

当T值较高时，生成结果将更为随机，当T值较低时，结果为更加稳定。

T作为其他领域的温度系数，提高时会提高熵（同样包括信息熵），熵的增加使得结果变得更难确定，更为随机。

大模型LLM

信息熵，N-Gram模型

信息熵

熵的值越小，序列就越具有确定性，更容易编码

香农率先提出了N-gram模型，即：

即一个未知token的预测只依赖于最后的n-1个字符。其缺点在于难以捕获Long-term依赖关系，更关心局部依赖。

神经语言模型

即利用神经网络实现以上概率的计算，随着RNN LSTM和Transformer的发展，神经网络逐渐取代了n-gram模型成为了主流。

大量语料库及大量的参数使得仅仅是预测下一个词这么简单的方式，就让深度学习模型学习到了大量的数量、语法、语义、文学、逻辑、世界知识等knowledge，这也是基于大数据的大模型研究的意义。

大模型的风险

可靠性：可能会产生错误及误导信息

社会偏见：从大量语料中学习到的错误或不合适的偏见

有害性：大量语料中存在有害信息，这些会被大模型所学习到

虚假信息：产生的信息人类难以辨别真伪

安全性：包括prompts，有害语料在内的漏洞风险

法律风险：版权问题难以解决

成本和环境影响：训练所需的GPU，及数据中心所需的大量电力及散热需求会带来巨大的环境影响

开放性：可以发现，随着大模型的发布，即使是开源的大模型，你也很难获取到其内部具体的训练细节或模型架构。

何草不玄丶

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

何草不玄丶 CSDN认证博客专家 CSDN认证企业博客

码龄4年

32: 原创

105万+: 周排名

30万+: 总排名

1万+: 访问

: 等级

336: 积分

2: 粉丝

4: 获赞

3: 评论

10: 收藏

私信

关注

热门文章

最新评论

学术论文插图绘制学习第二章
CSDN-Ada助手: 恭喜您撰写了第20篇博客！标题“学术论文插图绘制学习第二章”听起来非常有趣和富有挑战性。您的持续创作真是令人敬佩。在这个有关学术论文插图绘制的系列中，您已经分享了很多宝贵的知识和经验。接下来，我想提供一些建议，希望对您的下一步创作有所帮助。也许您可以考虑探讨一些实用技巧，例如如何选择最合适的图表类型来传达不同的信息，或者如何使用图表来提高读者对您的论文的理解度。此外，如果您能够分享一些常见的图表绘制错误以及如何避免它们的方法，那将非常有益。总之，我非常期待您未来的创作，并且对于您对学术论文插图绘制的研究感到钦佩。希望我的建议能够为您的下一步创作提供一些启发。祝您继续取得成功！
学术论文插图绘制学习第一章
CSDN-Ada助手: 恭喜您撰写第19篇博客！标题“学术论文插图绘制学习第一章”听起来非常有趣和有益。我很高兴看到您一直在持续创作，并且选择了如此重要的主题来分享。您的努力和热情对于向读者传达学术论文插图绘制的技巧和知识无疑将会产生积极的影响。在下一步的创作中，我建议您可以考虑深入探讨如何结合实际案例来说明学术论文插图绘制的重要性和技巧。这样的实例可以帮助读者更好地理解并应用您所分享的知识。同时，您也可以尝试与其他领域的专家或学者合作，以便获得更多的观点和见解。总的来说，您的博客已经走在了正确的道路上。继续努力，保持谦虚的态度，我相信您将继续为读者带来更多有价值的内容。期待您未来的创作！
推荐系统实战：新闻推荐系统基本流程
何草不玄丶: 有的，不过也是从https://github.com/datawhalechina/fun-rec这里进行本地化修改的，可以先参考一下
推荐系统实战：新闻推荐系统基本流程
南宫贇: 您好有完整的代码吗

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。