重磅！OpenAI 推出 GPT-4o 微调功能，这是教程：

Python编程杰哥

于 2024-08-23 20:49:46 发布

阅读量580

点赞数 10

文章标签：人工智能 chatgpt easyui 前端 javascript prompt

本文链接：https://blog.csdn.net/xx_nm98/article/details/141474518

版权

OpenAI 推出了 GPT-4o 的微调功能！

这意味着任何人都可以根据自己的特定需求来定制 OpenAI 的最强 AI 模型。

你一定听过那句老话：“授人以鱼，不如授人以渔。” 微调就像教会 ChatGPT 如何烹饪你喜欢的鱼，并确保每次都按照你的喜好来做！

从现在到 9 月 23 日，OpenAI 每天提供 100 万个免费训练 token（相当于可以用约 75 万字来训练 GPT-4o），这是任何人尝试微调的绝佳时机——即使你不懂编程也没关系！

操作步骤：

访问 OpenAI 微调仪表板（Fine Tune Dashboard）。
选择 “gpt-4o-2024-08-06” 作为基础模型。
上传你的训练数据——可以将“训练数据”理解为示例对话。

需要注意的是，你不能只上传一堆文本或 PDF 文件来让 ChatGPT 学习如何回应（如果你想这么做，可以尝试创建一个 CustomGPT）。

为了让 ChatGPT 理解，你需要把数据转换成 JSON 格式——可以把它想象成 GPT 用来准备菜肴的食谱。

如果你从未编写过代码，这可能看起来有点吓人，但实际上很简单。每个示例需要包括以下内容：

“system” 消息（告诉 GPT 它的角色）。
“user” 消息（用户的“提示”）。
“assistant” 消息（GPT 的回复）。

以下是完整的示例：

{  
  "messages": [  
    {"role": "system", "content": "You are a helpful assistant."},  
    {"role": "user", "content": "What's the capital of France?"},  
    {"role": "assistant", "content": "The capital of France is Paris."}  
  ]  
}

确保每个示例都在单独的一行，并且符合正确的 JSON 格式。

你至少需要 10 个示例，但建议准备 50-100 个示例以获得更好的效果。用烹饪鱼的比喻来说，这就像向 ChatGPT 展示一系列不同的鱼，但都是以相同的“手法”烹饪的。

接下来，上传你的数据，为你的模型命名一个后缀（例如：agi-hunt-bot），将其他设置保持默认，然后点击“创建”。

完成后，前往 OpenAI Playground，与微调后的模型对话，看看效果如何吧！

【附OpenAI 原文】👇

GPT-4o 微调功能现已推出

2024年8月20日

现在，您可以微调自定义版本的 GPT-4o，以提高应用程序的性能和准确性。

今天，我们正式推出了 GPT-4o[1] 的微调功能，这是开发者最为期待的功能之一。通过2024年9月23日之前，每个组织每天可以免费使用 100 万个训练 tokens。

开发者现在可以使用自定义数据集对 GPT-4o 进行微调，从而以更低的成本在特定应用场景下获得更高的性能。微调功能使模型能够根据复杂的领域特定指令自定义响应的结构和语调。开发者仅需在训练数据集中提供几十个示例，就能够为应用程序生成卓越的效果。

无论是编程还是创意写作，微调都能显著提升模型在各种领域的表现。这只是开始——我们将继续加大对模型自定义[2]选项的投资，为开发者提供更多支持。

如何开始

从今天起，所有付费使用层级[3]的开发者均可使用 GPT-4o 微调功能。

要开始使用，请访问微调控制台[4]，点击“创建”，并在基础模型下拉菜单中选择 gpt-4o-2024-08-06。GPT-4o 微调训练费用为每百万 tokens 25 美元，推理费用为每百万输入 tokens 3.75 美元，输出 tokens 15 美元。

GPT-4o mini 微调同样面向所有付费使用层级的开发者开放。访问微调控制台，并从基础模型下拉菜单中选择 gpt-4o-mini-2024-07-18。对于 GPT-4o mini，我们提供每天 200 万个训练 tokens 免费使用的优惠，直到2024年9月23日。

要了解如何使用微调功能，请访问我们的文档[5]。

通过 GPT-4o 微调实现最先进的性能

过去几个月，我们与几家受信任的合作伙伴合作，测试了 GPT-4o 的微调功能，并了解了他们的使用案例。以下是几个成功的例子：

Cosine 在 SWE-bench 基准测试中实现了最先进的结果

Cosine[6] 的 Genie 是一款 AI 软件工程助手，能够自主识别和解决 bug、构建功能，并与用户合作重构代码。它可以处理复杂的技术问题，并以更高的准确性和更少的 tokens 来修改代码。Genie 由微调后的 GPT-4o 模型驱动，模型通过学习真实软件工程师的工作示例，能够以特定方式响应。该模型还经过训练，能够输出特定格式的内容，例如可以轻松提交到代码库的补丁。

通过微调后的 GPT-4o 模型，Genie 在上周二发布的新 SWE-bench[7] Verified 基准测试中取得了 43.8% 的 SOTA（最先进）评分。在 SWE-bench Full 基准测试中，Genie 还保持了 30.08% 的 SOTA 评分，超过了之前的 SOTA 评分 19.27%，这是该基准测试中有史以来的最大进步。

Distyl 在 BIRD-SQL 基准测试中排名第一

Distyl[8] 是财富500强企业的 AI 解决方案合作伙伴，最近在领先的文本到 SQL 基准测试 BIRD-SQL[9] 中排名第一。Distyl 的微调 GPT-4o 在排行榜上达到了 71.83% 的执行准确率，并在查询重构、意图分类、思维链和自我修正等任务中表现出色，特别是在 SQL 生成方面表现尤为突出。

数据隐私与安全

微调后的模型完全由您控制，您拥有业务数据的全部所有权，包括所有输入和输出。这确保了您的数据不会被分享或用于训练其他模型。

我们还为微调后的模型实施了分层安全措施，以确保它们不会被滥用。例如，我们会对微调后的模型持续运行自动安全评估，并监控使用情况，以确保应用程序遵守我们的使用政策。

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述

第一阶段（10天）：初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识，对大模型 AI 的理解超过 95% 的人，可以在相关讨论时发表高级、不跟风、又接地气的见解，别人只会和 AI 聊天，而你能调教 AI，并能用代码将大模型和业务衔接。

大模型 AI 能干什么？
大模型是怎样获得「智能」的？
用好 AI 的核心心法
大模型应用业务架构
大模型应用技术架构
代码示例：向 GPT-3.5 灌入新知识
提示工程的意义和核心思想
Prompt 典型构成
指令调优方法论
思维链和思维树
Prompt 攻击和防范
…

第二阶段（30天）：高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习，学会构造私有知识库，扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架，抓住最新的技术进展，适合 Python 和 JavaScript 程序员。

为什么要做 RAG
搭建一个简单的 ChatPDF
检索的基础概念
什么是向量表示（Embeddings）
向量数据库与向量检索
基于向量检索的 RAG
搭建 RAG 系统的扩展知识
混合检索与 RAG-Fusion 简介
向量模型本地部署
…

第三阶段（30天）：模型训练

恭喜你，如果学到这里，你基本可以找到一份大模型 AI相关的工作，自己也能训练 GPT 了！通过微调，训练自己的垂直大模型，能独立训练开源多模态大模型，掌握更多技术方案。

到此为止，大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗？

为什么要做 RAG
什么是模型
什么是模型训练
求解器 & 损失函数简介
小实验2：手写一个简单的神经网络并训练它
什么是训练/预训练/微调/轻量化微调
Transformer结构简介
轻量化微调
实验数据集的构建
…

第四阶段（20天）：商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知，可以在云端和本地等多种环境下部署大模型，找到适合自己的项目/创业方向，做一名被 AI 武装的产品经理。

硬件选型
带你了解全球大模型
使用国产大模型服务
搭建 OpenAI 代理
热身：基于阿里云 PAI 部署 Stable Diffusion
在本地计算机运行大模型
大模型的私有化部署
基于 vLLM 部署大模型
案例：如何优雅地在阿里云私有部署开源大模型
部署一套开源 LLM 项目
内容安全
互联网信息服务算法备案
…

学习是一个过程，只要学习就会有挑战。天道酬勤，你越努力，就会成为越优秀的自己。

如果你能在15天内完成所有的任务，那你堪称天才。然而，如果你能完成 60-70% 的内容，你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】

在这里插入图片描述

Python编程杰哥

关注

10
点赞
踩
17

收藏

觉得还不错? 一键收藏
0
评论
重磅！OpenAI 推出 GPT-4o 微调功能，这是教程：

这意味着任何人都可以根据自己的特定需求来定制 OpenAI 的最强 AI 模型。你一定听过那句老话：“授人以鱼，不如授人以渔。” 微调就像教会 ChatGPT 如何烹饪你喜欢的鱼，并确保每次都按照你的喜好来做！从现在到 9 月 23 日，OpenAI 每天提供 100 万个免费训练 token（相当于可以用约 75 万字来训练 GPT-4o），这是任何人尝试微调的绝佳时机——即使你不懂编程也没关系！
复制链接

扫一扫