LLM之大模型Base、Chat、Instruction之间的区别了解

黑夜寻白天

已于 2025-01-07 14:59:11 修改

阅读量1.3k

点赞数 5

分类专栏： NLP入门文章标签：深度学习机器学习人工智能

于 2025-01-06 17:54:23 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44598554/article/details/144969136

版权

NLP入门专栏收录该内容

18 篇文章

订阅专栏

前言

在大模型的使用当中，我们常常能看到三种模型：基座模型（base）、聊天模型（chat）和指令模型（instruct），在选用的时候，有时候还挺纠结的，就将它们的区别学习记录了下

Base模型

定义：Base模型通常是指未经特定任务微调的基础预训练模型，其在大量无标注数据上进行预训练，从而学习到广泛语言特征的模型。这些模型拥有庞大的参数规模，能够在多种任务上展现出卓越的性能，无需从零开始训练

特点与应用：这些模型通常用于进一步的微调，以适应特定任务或应用场景。如：智能对话、文本内容生成等

我的理解：一个人读了很多书，但是它只读书，不做题或加以思考，参加考试恐怕不会很理想

Chat模型

定义：Chat模型是在Base模型的基础上，针对对话和人机交互进行优化的模型，这类模型能够理解上下文，维持对话历史，生成连贯且情境相关的响应。

特点与应用：

Chat模型训练方式通常包含对话数据的监督学习以及强化学习。其训练数据包含了大量的多轮对话，模型学习如何基于对话的上下文生成合适的回应。此外，强化学习（通常是通过人类反馈的强化学习，RLHF）用于进一步调整模型的输出，使其更符合用户的期望和礼貌准则

用于生成自然语言对话，能够理解上下文并生成连贯且有意义的回复。如：聊天机器人、客服系统，特别适用于需要与用户进行多轮对话并保存上下文连贯的场合。

我的理解：与base模型相比，经过大量的多轮对话训练，能够维持对话历史，生成合理的回应，在经过微调，可以模拟自己喜欢的人物进行对话了，例如孙悟空，二次元动漫等等

Instruction模型

定义：Instruction模型是在Base模型的基础上，通过监督学习特别优化以理解和执行自然语言指令的模型

特点与应用：

Instruction模型通过指令优化，能够高效地执行各种任务，如调取某个工具使用、购买车票、查询天气、设备控制等指令，这些往往需要输出特定格式以调取第三方接口的，其训练过程中使用标注的指令-响应（instruction-response）数据集进行优化，模型在训练时会接收明确的任务指令，并根据指令生成合适的输出。

指令理解：Instruction模型的核心优势是其理解并遵循自然语言指令的能力

清晰输出：Instruction模型往往生成直接答案或者响应，避免了生成冗长、不相干的内容

我的理解：相对于chat模型，在对话能力上可能有所欠缺，或者说文本创造能力有所下降，但是遵循指令，完成特定任务方面更强

参考链接：

大模型各版本Base, Chat, Instruction 之间的区别

一文了解大模型的三种类型

欢迎大家点赞或收藏~

大家的点赞或收藏可以鼓励作者加快更新哟

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。