大语言模型-LLM简介

最新推荐文章于 2024-07-24 11:45:26 发布

Mark_Aussie

最新推荐文章于 2024-07-24 11:45:26 发布

阅读量1.6k

点赞数

分类专栏： nlp 文章标签：自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/MarkAustralia/article/details/134308815

版权

nlp 专栏收录该内容

59 篇文章 3 订阅

订阅专栏

大语言模型如此火爆，查了些资料整理一下，做个初步的了解。

语言模型的发展从开始的统计方法到使用神经网络，再到现在通过使用Transformer架构的模型训练大量数据，理解文本规则和模式，同时随着训练数据和模型的扩大，语言模型的能力提升显著，此时大语言模型出现了-LLM。

相比于之前的明星模型-BERT，虽然大预言模型使用的架构和预训练任务相似，但参数数量级的提升使他们有了质的差别。BERT的参数为3.3亿，GPT-2为15亿，而GPT-3则有1750亿参数。此时GPT-3相比之前的模型，就有解决少样本任务的能力了，这种能力可称为涌现能力。

LLM的独特能力

上下文学习：语言模型在获得指令或任务示例时，通过上下文生成答案，此时不需要额外训练或更新参数。

指令微调：LLM可以处理未见过的任务，泛化能力强大。

推理能力：LLM可通过中间推理步骤的提示机制解决中间的任务得到最终的答案。

LLM的特点

模型规模大：参数通常在数十亿，甚至千亿规模，这也是大模型可以获取更多信息的基础。

预训练和微调：LLM使用大量无标签文本数据做预训练，获取通用的知识，再通过微调在单独任务重获得更好的效果。

上下文理解：可解决小模型对前文理解不足的问题。

支持多模态：LLM可支持图像、声音等内容的扩展。

现有的大模型

LLM大放异彩是从OpenAI发布ChatGPT开始的，后面还有Claude、PaLM、Bard等，但由于网络原因，并不好用，而且还需要国际支付以获取user key，国内使用不是很友好。

国内的LLM主要有文心一言、讯飞星火、通义千问等，分别由百度、讯飞、阿里推出。放开测试后只需手机号就能使用，但有些功能需要收费了。

LangChain

一个开源工具，帮助开发者调用大模型并应用于下游任务，其为LLM提供了通用接口，简化开发流程。

主要有六个标准接口：

Input/Output：用户输入及模型输出的结果

Data：将自由数据输入模型训练

Chain：链接多个LLM或组件

Memory：对每个用户生成短期记忆，加强对上文的理解

Agent：为LLM提供计算、检索等功能的支持

Callback：记录流程信息

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
大语言模型-LLM简介

LLM
复制链接

扫一扫

专栏目录

Mark_Aussie CSDN认证博客专家 CSDN认证企业博客

码龄8年

224: 原创

7万+: 周排名

1万+: 总排名

39万+: 访问

: 等级

2746: 积分

190: 粉丝

304: 获赞

68: 评论

1369: 收藏

私信

关注

热门文章

分类专栏

Python 51篇
nlp 59篇
机器学习 47篇
AIOps 32篇
排序算法 9篇
C语言
JDK翻译 5篇
数据库 4篇

最新评论

Log BERT 日志异常检测
qq_45834721: 问一下大家有复现出论文里面提到的效果吗
Log BERT 日志异常检测
lym4a1: 这个本来就是没到语义那一级，你还在做这方面研究吗？你对参数异常这块有什么想法吗
LSTM理解及梯度消失与爆炸
CSDN-Ada助手: 百度的paddlepadle库做的不错，不知道是否用过呢？
算法知识小结
CSDN-Ada助手: 推荐算法技能树：https://edu.csdn.net/skill/algorithm?utm_source=AI_act_algorithm
机器学习-逻辑回归总结
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加条理清晰的目录；(2)提升标题与正文的相关性；(3)使用更多的站内链接。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。