【什么是指令微调】

你真讨喜

于 2024-08-15 10:55:47 发布

阅读量158

点赞数 4

文章标签：深度学习机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_44283562/article/details/141216670

版权

学习目标：

指令微调

学习内容：

模型训练的过程：预处理、预训练、微调、强化学习、模型评估

什么是预训练？

预训练指的是先使用大量的文本数据训练一个模型，让它学会语言的基本规律，比如词汇的意义、句子的结构等。这些模型通常是大规模的语言模型，例如BERT、GPT等。

什么是微调？

微调是在预训练的基础上，使用特定领域的数据或任务相关的数据来进一步训练模型，以便它能够更好地执行某个具体任务。微调通常只需要少量的数据和修改模型的一部分参数。

什么是指令微调？

指令微调是一种特殊的微调技术，它的目标是让模型能够理解和执行人类给出的指令。在指令微调过程中，我们会提供一系列的指令和预期的结果对（指令-输出对），模型通过学习这些对来学会如何正确地执行类似的指令。

例如，如果我们要训练一个模型来帮助我们写电子邮件，我们可以给它这样的指令：“写一封感谢信给客户”，并附上一个合适的感谢信样本作为期望输出。模型会通过学习这类指令和样本，逐渐学会如何写出符合要求的感谢信。

关注

4
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
【什么是指令微调】

指令微调是一种特殊的微调技术，它的目标是让模型能够理解和执行人类给出的指令。在指令微调过程中，我们会提供一系列的指令和预期的结果对（指令-输出对），模型通过学习这些对来学会如何正确地执行类似的指令。微调是在预训练的基础上，使用特定领域的数据或任务相关的数据来进一步训练模型，以便它能够更好地执行某个具体任务。预训练指的是先使用大量的文本数据训练一个模型，让它学会语言的基本规律，比如词汇的意义、句子的结构等。模型训练的过程：预处理、预训练、微调、强化学习、模型评估。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。