GPT-4和ChatGPT的高级技巧---微调

最新推荐文章于 2024-08-13 14:10:09 发布

三月七꧁ ꧂

最新推荐文章于 2024-08-13 14:10:09 发布

阅读量475

点赞数 4

分类专栏：大模型开发文章标签： chatgpt python 人工智能 AIGC 文心一言自然语言处理开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43961909/article/details/140447339

版权

大模型开发专栏收录该内容

15 篇文章 0 订阅 ¥9.90 ¥99.00

订阅专栏

超级会员免费看

文章目录

- 开始微调
- 使用OpenAIAPI进行微调

OpenA提供了许多可直接使用的GPT模型。尽管这些模型在各种任务上表现出色，但针对特定任务或上下文对它们进行微调，可以进一步提高它们的性能。

开始微调

假设你想为公司创建一个电子邮件自动回复生成器。由于你的公司所在的行业使用专有词汇，因此你希望生成器给出的电子邮件回复保持一定的写作风格。要做到这一点，有两种策略：要么使用之前介绍的提示工程技巧来强制模型输出你想要的文本，要么对现有模型进行微调。对于这个例子，你需要收集大量电子邮件，其中包含关于特定业务领域的数据、客户咨询及针对这些咨询的回复。然后，你可以使用这些数据微调现有模型，以使模型学习公司所用的语言模式和词汇。

微调后的模型本质上是基于OpenAI提供的原始模型构建的新模型，其中模型的内部权重被调整，以适应特定问题从而能够在相关任务上提高准确性。通过对现有模型进行微调，你可以创建一个专门针对特定业务所用语言模式和词汇的电子邮件自动回复生成器。下图展示了微调过程，也就是使用特定领域的数据集来更新现有GPT模型的内部权重。微调的目标是使新模型能够在特定领域中做出比原始GPT模型更好的预测。需要强调的是，微调后的模型是新模型它位于OpenAl的服务器上。与之前的模型一样，你必须使用OpenAI API来使用它，因为它无法在本地使用。即使你使用自己的数据对LLM进行了微调，新模型也仍然保存在OpenA的服务器上。你需要通过OpenAIAPI与新模型进行交互，而不是在本地使用它。

图片名称

了解本专栏

超级会员免费看

三月七꧁ ꧂

关注

4
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
GPT-4和ChatGPT的高级技巧---微调

微调除了文中提到的确保模型生成内容更符合目标领域的特定语言模式、词汇和语气，还有一个优势：你可以通过微调缩短每一次提示中重复的指令或提示词以节省成本或降低延迟，模型会记住通过微调获得的内置指令。开发人员可以为应用程序选择最合适的模型：较小的模型（ada和babbage）可能在简单任务或资源有限的应用程序中更快且更具成本效益，较大的模型 curie 和davinci）则提供了更强的语言处理和生成能力，从而适用于需要更高准确性的复杂任务。需要强调的是，微调后的模型是新模型它位于OpenAl的服务器上。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

三月七꧁ ꧂ 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。