OpenAI Model

最新推荐文章于 2023-09-19 19:33:41 发布

mypc56

最新推荐文章于 2023-09-19 19:33:41 发布

阅读量241

点赞数

文章标签：人工智能深度学习

原文链接：https://platform.openai.com/docs/models/gpt-3

版权

OpenAI API 由具有不同功能和价位的多种模型提供支持。您还可以通过微调针对您的特定用例对我们的原始基础模型进行有限的定制。

MODELS	DESCRIPTION
GPT-4 Limited beta	A set of models that improve on GPT-3.5 and can understand as well as generate natural language or code
GPT-3.5	A set of models that improve on GPT-3 and can understand as well as generate natural language or code
DALL·E Beta	A model that can generate and edit images given a natural language prompt
Whisper Beta	A model that can convert audio into text
Embeddings	A set of models that can convert text into a numerical form
Moderation	A fine-tuned model that can detect whether text may be sensitive or unsafe
GPT-3	A set of models that can understand and generate natural language
Codex Deprecated	A set of models that can understand and generate code, including translating natural language to code

我们还发布了开源模型，包括Point-E、Whisper、Jukebox和CLIP。

访问我们的研究人员模型索引，详细了解我们的研究论文中介绍了哪些模型以及 InstructGPT 和 GPT-3.5 等模型系列之间的差异。

GPT-4

有限公测

GPT-4 是一个大型多模态模型（今天接受文本输入并发出文本输出，将来会出现图像输入），由于其更广泛的常识和高级推理，它可以比我们以前的任何模型更准确地解决难题能力。与一样gpt-3.5-turbo，GPT-4 针对聊天进行了优化，但也适用于传统的完成任务。在我们的聊天指南中了解如何使用 GPT-4 。

GPT-4 目前处于有限测试阶段，只有获得访问权限的人才能访问。请加入候补名单，以便在容量可用时获得访问权限。

最新款	描述	最大代币	训练数据
gpt-4	比任何 GPT-3.5 模型都更强大，能够执行更复杂的任务，并针对聊天进行了优化。将使用我们最新的模型迭代进行更新。	8,192 个代币	截至 2021 年 9 月
gpt-4-0314	2023 年 3 月 14 日的快照`gpt-4`。与不同的是`gpt-4`，此模型不会收到更新，并且只会在 2023 年 6 月 14 日结束的三个月内提供支持。	8,192 个代币	截至 2021 年 9 月
gpt-4-32k	与基本`gpt-4`模式相同的功能，但上下文长度是其 4 倍。将使用我们最新的模型迭代进行更新。	32,768 个代币	截至 2021 年 9 月
gpt-4-32k-0314	2023 年 3 月 14 日的快照`gpt-4-32`。与不同的是`gpt-4-32k`，此模型不会收到更新，并且只会在 2023 年 6 月 14 日结束的三个月内提供支持。	32,768 个代币	截至 2021 年 9 月

对于许多基本任务，GPT-4 和 GPT-3.5 模型之间的差异并不显着。然而，在更复杂的推理情况下，GPT-4 比我们之前的任何模型都更有能力。

GPT-3.5

GPT-3.5 模型可以理解并生成自然语言或代码。我们在 GPT-3.5 系列中功能最强大且最具成本效益的模型gpt-3.5-turbo已针对聊天进行了优化，但也适用于传统的完成任务。

最新款	描述	最大代币	训练数据
gpt-3.5-turbo	功能最强大的 GPT-3.5 模型，并针对聊天进行了优化，成本仅为`text-davinci-003`. 将使用我们最新的模型迭代进行更新。	4,096 个代币	截至 2021 年 9 月
gpt-3.5-turbo-0301	2023 年 3 月 1 日的快照`gpt-3.5-turbo`。与不同的是`gpt-3.5-turbo`，此模型不会收到更新，并且只会在 2023 年 6 月 1 日结束的三个月内提供支持。	4,096 个代币	截至 2021 年 9 月
文本-davinci-003	可以以比居里、巴贝奇或 ada 模型更好的质量、更长的输出和一致的指令遵循来完成任何语言任务。还支持在文本中插入补全。	4,097 个代币	截至 2021 年 6 月
文本-davinci-002	类似的能力，`text-davinci-003`但训练有监督的微调而不是强化学习	4,097 个代币	截至 2021 年 6 月
代码-davinci-002	针对代码完成任务进行了优化	8,001 个代币	截至 2021 年 6 月

我们建议使用gpt-3.5-turbo其他 GPT-3.5 模型，因为它的成本较低。

OpenAI 模型是不确定的，这意味着相同的输入可以产生不同的输出。将温度设置为 0 将使输出大部分具有确定性，但可能会保留少量可变性。

特定功能模型

虽然新gpt-3.5-turbo模型针对聊天进行了优化，但它非常适合传统的完成任务。原始的 GPT-3.5 模型针对文本补全进行了优化。

我们用于创建嵌入和编辑文本的端点使用它们自己的一组专用模型。

找到合适的模型

进行试验gpt-3.5-turbo是了解 API 功能的好方法。在您了解要实现的目标之后，您可以继续使用gpt-3.5-turbo或使用其他模型并尝试围绕其功能进行优化。

您可以使用GPT 比较工具，让您并排运行不同的模型来比较输出、设置和响应时间，然后将数据下载到 Excel 电子表格中。

DALL·E 是一个人工智能系统，可以根据自然语言的描述创建逼真的图像和艺术作品。我们目前支持在提示的情况下创建具有特定大小的新图像、编辑现有图像或创建用户提供的图像的变体的能力。

通过我们的 API 提供的当前 DALL·E 模型是 DALL·E 的第 2 次迭代，具有比原始模型更逼真、更准确且分辨率高 4 倍的图像。您可以通过我们的实验室界面或API进行试用。

Whisper 是一种通用的语音识别模型。它在不同音频的大型数据集上进行训练，也是一个多任务模型，可以执行多语言语音识别以及语音翻译和语言识别。Whisper v2-large 模型目前可通过我们的 API 使用whisper-1模型名称获得。

目前， Whisper 的开源版本与通过我们的 API 提供的版本之间没有区别。然而，通过我们的 API，我们提供了一个优化的推理过程，这使得通过我们的 API 运行 Whisper 比通过其他方式运行要快得多。有关 Whisper 的更多技术细节，您可以阅读论文。

嵌入是文本的数字表示，可用于衡量两段文本之间的相关性。我们的第二代嵌入模型text-embedding-ada-002旨在以一小部分成本取代之前的 16 种第一代嵌入模型。嵌入可用于搜索、聚类、推荐、异常检测和分类任务。您可以在公告博客文章中阅读有关我们最新嵌入模型的更多信息。

审核模型旨在检查内容是否符合 OpenAI 的使用政策。这些模型提供了查找以下类别内容的分类功能：仇恨、仇恨/威胁、自残、性、性/未成年人、暴力和暴力/图片。您可以在我们的审核指南中找到更多信息。

审核模型接受任意大小的输入，该输入会自动分解以修复模型特定的上下文窗口。

模型	描述
文本审核最新	最有能力的审核模型。精度会比稳定模型略高
文本审核稳定	几乎与最新型号一样强大，但稍旧一些。

GPT-3

GPT-3 模型可以理解和生成自然语言。这些模型被更强大的 GPT-3.5 代模型所取代。但是，原始 GPT-3 基本模型（davinci、curie、ada和babbage）是当前唯一可用于微调的模型。

最新款	描述	最大代币	训练数据
文本-居里-001	非常有能力，比达芬奇更快，成本更低。	2,049 个代币	截至 2019 年 10 月
text-babbage-001	能够执行简单的任务，速度非常快，成本更低。	2,049 个代币	截至 2019 年 10 月
文本-ada-001	能够执行非常简单的任务，通常是 GPT-3 系列中最快的型号，而且成本最低。	2,049 个代币	截至 2019 年 10 月
达芬奇	功能最强大的 GPT-3 模型。可以完成其他模型可以完成的任何任务，而且通常质量更高。	2,049 个代币	截至 2019 年 10 月
居里	非常有能力，但比达芬奇更快，成本更低。	2,049 个代币	截至 2019 年 10 月
白菜	能够执行简单的任务，速度非常快，成本更低。	2,049 个代币	截至 2019 年 10 月
阿达	能够执行非常简单的任务，通常是 GPT-3 系列中最快的型号，而且成本最低。	2,049 个代币	截至 2019 年 10 月

Codex 模型现已弃用。他们是我们 GPT-3 模型的后代，可以理解和生成代码。他们的训练数据包含自然语言和来自 GitHub 的数十亿行公共代码。了解更多。

他们最擅长 Python，精通 JavaScript、Go、Perl、PHP、Ruby、Swift、TypeScript、SQL，甚至 Shell 等十几种语言。

以下 Codex 模型现已弃用：

最新款	描述	最大代币	训练数据
代码-davinci-002	功能最强大的 Codex 型号。特别擅长将自然语言翻译成代码。除了补全代码，还支持在代码中插入补全。	8,001 个代币	截至 2021 年 6 月
代码-davinci-001	早期版本`code-davinci-002`	8,001 个代币	截至 2021 年 6 月
代码-cushman-002	几乎与 Davinci Codex 一样强大，但速度稍快。这种速度优势可能使其成为实时应用程序的首选。	最多 2,048 个代币
代码-cushman-001	早期版本`code-cushman-002`	最多 2,048 个代币

有关更多信息，请访问我们的Codex 工作指南。

模型端点兼容性

端点	型号名称
/v1/聊天/完成	gpt-4、gpt-4-0314、gpt-4-32k、gpt-4-32k-0314、gpt-3.5-turbo、gpt-3.5-turbo-0301
/v1/完成	text-davinci-003, text-davinci-002, text-curie-001, text-babbage-001, text-ada-001, 达芬奇, 居里, 巴贝奇, ada
/v1/编辑	文本-davinci-edit-001，代码-davinci-edit-001
/v1/音频/转录	耳语-1
/v1/音频/翻译	耳语-1
/v1/微调	达芬奇、居里、巴贝奇、艾达
/v1/嵌入	文本嵌入-ada-002，文本搜索-ada-doc-001
/v1/节制	文本审核稳定，文本审核最新

此列表不包括我们的第一代嵌入模型和我们的DALL·E 模型。

持续的模型升级

随着的发布gpt-3.5-turbo，我们的一些模型现在正在不断更新。为了减少模型更改以意外方式影响我们用户的可能性，我们还提供将在 3 个月内保持静态的模型版本。随着模型更新的新节奏，我们还让人们能够贡献评估，以帮助我们针对不同的用例改进模型。如果您有兴趣，请查看OpenAI Evals存储库。

以下模型是将在指定日期弃用的临时快照。如果您想使用最新的模型版本，请使用标准模型名称，例如gpt-4或gpt-3.5-turbo。

型号名称	弃用日期
gpt-3.5-turbo-0301	2023 年 6 月 1 日
gpt-4-0314	2023 年 6 月 14 日
gpt-4-32k-0314	2023 年 6 月 14 日

mypc56

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
OpenAI Model

然而，通过我们的 API，我们提供了一个优化的推理过程，这使得通过我们的 API 运行 Whisper 比通过其他方式运行要快得多。GPT-4 是一个大型多模态模型（今天接受文本输入并发出文本输出，将来会出现图像输入），由于其更广泛的常识和高级推理，它可以比我们以前的任何模型更准确地解决难题能力。然而，在更复杂的推理情况下，GPT-4 比我们之前的任何模型都更有能力。通过我们的 API 提供的当前 DALL·E 模型是 DALL·E 的第 2 次迭代，具有比原始模型更逼真、更准确且分辨率高 4 倍的图像。
复制链接

扫一扫