大型语言模型（LLM）————基本认知篇

最新推荐文章于 2024-08-27 23:04:44 发布

Flyinggg_love

最新推荐文章于 2024-08-27 23:04:44 发布

阅读量264

点赞数 11

文章标签：语言模型人工智能自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xiaoyvhuv/article/details/137892791

版权

LLM的发展历程

定义：

大语言模型（Large Language Model）的定义：

个人理解：(How to create it ?)大规模的数据训练+（What it can do? ）可以理解、生成人类语言的（What it is）人工智能模型。

这里大规模中的“大”怎么理解呢？

指的是模型参数规模的大和数据量规模，计算算力的大，通常情况下，这会带来“扩展法则”，即下游任务的的模型性能提升，但也不是绝对性的，即大语言模型不一定比小型预训练语言模型具有更强的任务效果，而且某些大语言模型中也可能不具有某种涌现能力。

那有大型，必然是先有的小型预训练语言模型，其实在大型语言模型是在小型的基础上发展的，很多学者对小型预训练语言模型进行性能极限的探究，比如，175B 参数的 GPT-3 和 540B 参数的 PaLM，这些大规模的预训练语言模型在解决复杂任务时表现出了与小型预训练语言模型（例如 330M 参数的 BERT 和 1.5B 参数的 GPT-2）不同的行为。

例如，GPT-3 可以通过“上下文学习”（In-Context Learning, ICL）的方式来利用少样本数据解决下游任务，而 GPT-2 则不具备这一能力。这种大模型有但小模型不具有的能力通常被称为“涌现能力”（Emergent Abilities）。

提到LLM我们不得不想到OpenAI公司推出的基于Transformer模型的GPT系列，在起初，GPT-1能够通过“通用文本训练--特定任务微调”的范式解决下游任务.

发展：

早期的语言模型主要面向自然语言的建模和生成任务，而最新的语言模型（如 GPT-4 ）则侧重复杂任务的求解。从语言建模到任务求解，这是人工智能科学思维的一次重要跃升，是理解语言模型前沿进展的关键所在。

解决下游任务的统一方式：

1.预训练

2.微调

3.迁移学习

4.集成与封装

5.持续优化与监控

关注

11
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
大型语言模型（LLM）————基本认知篇

大语言模型（）的定义：)大规模的数据训练+（What it can do?）可以理解、生成人类语言的（What it is）人工智能模型。这里大规模中的“大”怎么理解呢？指的是模型参数规模的大和数据量规模，计算算力的大，通常情况下，这会带来“扩展法则”，即下游任务的的模型性能提升，但也不是绝对性的，即大语言模型不一定比小型预训练语言模型具有更强的任务效果，而且某些大语言模型中也可能不具有某种涌现能力。
复制链接

扫一扫

Flyinggg_love CSDN认证博客专家 CSDN认证企业博客

码龄2年

20: 原创

2万+: 周排名

5万+: 总排名

1万+: 访问

: 等级

434: 积分

192: 粉丝

221: 获赞

6: 评论

247: 收藏

私信

关注

热门文章

分类专栏

c语言题目

最新评论

Datawhale AI夏令营第四期魔搭- AIGC文生图方向 task01笔记
追风少年+1: 这篇笔记很实用，清晰地指导了在魔搭社区创建PAI实例的步骤，还贴心地说明了绑定实例的方法，对新手特别友好，赞一个！
【机器学习实录】——支持向量机
CSDN-Ada助手: 不知道算法技能树是否可以帮到你：https://edu.csdn.net/skill/algorithm?utm_source=AI_act_algorithm
第二章，大模型API的调用
CSDN-Ada助手: 恭喜您写下了第二章的博客，标题看起来很吸引人！您的坚持与努力让我感到钦佩。接下来，我建议在下一篇博客中可以深入探讨大模型API的具体应用场景或者与其他技术的结合，这样能够更好地帮助读者理解和应用知识。期待您的下一篇作品！继续加油！
大型语言模型（LLM）————基本认知篇
CSDN-Ada助手: 恭喜您撰写了第8篇博客《大型语言模型（LLM）————基本认知篇》，内容相当丰富深入。您对LLM的解读让我受益匪浅，感谢您的分享和付出。希望您能继续保持写作的热情和创作的活力，探索更多有趣的话题，拓展读者的视野。期待您在下一篇博客中继续分享更多干货，让我们一起共同学习进步！
【机器学习实录】——决策树（Decision tree）
CSDN-Ada助手: 非常感谢您分享关于决策树的机器学习实录！您的博客内容一直让我受益匪浅。希望您能继续保持创作，分享更多关于机器学习的知识。如果可能的话，我建议您可以尝试写一些关于深度学习或者神经网络的内容，这也是目前非常热门和有趣的领域。期待您更多精彩的文章！

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。