OpenAI文档翻译——场景的模型以及差异

最新推荐文章于 2024-05-03 16:04:41 发布

码涤生

最新推荐文章于 2024-05-03 16:04:41 发布

阅读量669

点赞数 1

分类专栏： ChatGPT&OpenAI官方文档翻译文章标签：人工智能机器学习深度学习

本文链接：https://blog.csdn.net/lmlzww/article/details/130181924

版权

ChatGPT&OpenAI官方文档翻译专栏收录该内容

4 篇文章 0 订阅

订阅专栏

OpenAI API由一系列的不同价格不同能力的模型来提供服务。你也可以通过微调模型对原有模型进行一定的训练从而解决特定领域的一些问题。

模型	描述
GPT-4	基于GPT-3.5改进而来，可以更好的理解和生成文本内容或是代码
GPT-3.5	基于GPT-3改进而来，可以更好的理解和生成文本内容或是代码
DALL.E	可以根据提示词生成图像，并根据提示词上下文对生成的图像进行修改
Whisper	将引擎转换成文本
Embeddings	一组可以将文本转换成数字的模型
Moderation	进过一定微调可以判定文本中是否包含敏感或是不安全的内容
GPT-3	可以裂解或是处理自然语言（提示词）
Codex	一组可以理解和处理代码的模型，并且也提供从提示词到代码的生成，目前处于开阶段

官方也发布了包含Point-E、Whisper、Jukebox、CLIP模型在内的开源代码。通过阅读模型指南来了解我们的论文中涉及到的有哪些模型，以及就像InstructGPT和GPT-3.5之间的差异。

GPT-4

GPT-4是一个大的多模态模型（现在可以接受文本输出文本，将来还会实现对图像输入的支持）他可以比之前其他的任何模型更好、更准确的解决难题，这一切得益于他大量的数据训练以及超前的推理能力。与gpt-3.5-turbo一样，GPT4对聊天进行了优化但是对以往的任务处理也很好地支持。我们可以在会话指南中学习如何更好的使用GPT-4。

GPT-4目前处于有限的测试阶段，只有被授予访问权限的人才能访问，你可以通过申请链接加入等待以获得授权

模型版本	描述	最大令牌量	训练数据
gpt-4	针对回话进行优化，相对于GPT-3.5有更强的能力能够处理风复杂的任务，他也将会与随我们最新的模型一同更新	8192	截至2021年9月
gpt-4-0314	gpt-4的2023年3月14日的快照，与gpt-4不同的是，该模型将不会接受更新，并且只会在2023年6月14日结束的三个月内得到支持	8192	截至2021年9月
gpt-4-32k	功能上与GPT4基础版相同，但上下文长度是它的4倍，他将与我们最新的模型一同迭代更新	32768	截至2021年9月
gpt-4-32k-0314	gpt-4-32k的2023年3月14日快照，与gpt-4不同的是，该模型将不会接受更新，并且只会在2023年6月14日结束的三个月内得到支持	32768	截至2021年9月

对于许多基本任务，GPT-4和GPT-3.5模型之间并没有显著的差异。然而在复杂的情况下，GPT-4比之前的任何模型都更强！哈哈当然最强的肯定是在未来的5、6、7、8、9.....

GPT-3.5

GPT-3.5能够理解和生成自然语言以及代码，在此版本中的系列模型中，GPT3.5-turbo是能力最强成本相对最低的模型，他对回话进行了优化同时能够很好的处理普通任务。

模型版本	描述	最大令牌量	训练数据
gpt-3.5-turbo	能力最强大的模型，针对回话进行了优化并且成本只有text-davinci-003的十分之一，他将与最新的模型一同迭代更新。	4096	截至2021年9月
gpt-3.5-turbo-0301	2023年3月1日gpt-3.5-turbo的快照。与gpt-3.5-turbo不同的是，该型号将不接受更新，并且只支持三个月的时间，截止到2023年6月1日	4096	截至2021年9月
text-davinci-003	与Curibe、Babbage、Ada模型相比可以支持更长的上下文，更高质的完成对话任务，还支持在文本中插入补全	4097	截至2021年6月
text-davinci-002	能力与text-davinci-003类似，但是是通过监督微调进行训练，而非是强化学习	4097	截至2021年6月
code-davinci-002	优化代码生成能力	8001	截至2021年6月

我们推荐使用GPT-3.5 -turbo而不是其他GPT-3.5型号，因为它的成本更低。OpenAI 的模型内容生成式不确定的，所以会存在同样的输入会有不通的输出，将temperature 设置为0将会降低这种相同输入不通输出的发生以及他们的差异化程度，但是任然不能够保证相同输入一定产生相同的输出。

通过尝试使用gpt-3.5-turbo模型是一个熟悉API有哪些能力的好方法，当你知道自己想要通过API去完成一些什么东西的时候，你可以通过gpt-3.5-turbo或是其他的模型来围绕其功能进行优化。你也可以使用GPT对比工具来同时运行多个模型并行的比较输出、设置、相应时间，并且可以将这些信息以Excel的形式下载下来。

DALL.E

DALL·E是一个可以根据自然语言的描述创建逼真的图像和艺术作品的智能系统。目前支持在给定提示词的情况下创建具有一定大小的新图像、编辑现有图像或或是基于用户提供的图像进行创新。目前通过API提供的模型是DALL·E第二代模型，相对于前面的模型它的图像创作更加真实、准确、分辨率也提高了四倍。你可以通过注册账号进行试用或是通过API来进行调用。

Whisper

Whisper是一个通用的语音识别模型，他是在各种音频的大数据集上训练的，也是一个可以执行多语言语音识别以及语音翻译和语言类型鉴别的多任务模型。Whisper v-2模型现在可以通过API进行调用。目前开源的版本与我们现在通过调用API使用的版本没有区别。不过在API的调用过程中提供了一个优化的推理过程，这使得通过API运行Whisper比通过其他方式快得多。关于Whisper的更多设计可以阅读有关它的详细介绍

Embeddings

Embeddings被定义为文本的数字表现形式，他可以用来衡量两个文本之间的相关性。第二代Embedding模型“text-embedding-ada-002”被设计用来取代原来的16个第一个代Embedding模型，使用成本上相对于之前也有降低。Embedding主要用于搜索、聚类、推荐、异常检测和分类场景。相关Embedding 的更多信息可以参考它详细介绍

Moderation

Moderation主要是用来检测输入的提示词中是否包含敏感词是否符合OpenAI的使用政策。这些模型提供了分类功能，分类主要包括:仇恨、仇恨/威胁、自残、性、性/未成年人、暴力和暴力/图形。Moderation模型可以接受任意大小的输入，之后将它进行切割从而适应其他模型对于上下文长度的限制。

模型	描述
text-moderation-latest	最强的调节模型,精度略高于text-moderation-stable
text-moderation-stable	性能与新的模型几乎一言但是就是老了些

GPT-3

GPT模型能够处理和生成自然语言，不过这些模型被更加强大的GPT-3.5所取代。不过，最初的GPT-3基础模型(davinci、curie、ada和babbage)是目前唯一可用于微调的模型。

模型	描述	最大Token	更新日期
text-curie-001	相对于Davinci能力更强，性能更高，使用成本也更低	2049	2019年10月
text-babbage-001	能够完成简单的任务但是处理速度非常快，花费的成本也更低	2049	2019年10月
text-ada-001	只能够处理非常简单的任务，通常来说在GPT-3系列的模型中它的成本是最低的处理速度也是最快的	2049	2019年10月
davinci	是GPT-3系列中处理能力最强的模型，相对于其他的模型他几乎能够处理所有的任务，返回高质量的结果	2049	2019年10月
curie	处理能力略低于Davinic但是花费的成本也更低处理速度也更快	2049	2019年10月
babbage	能够完成简单的任务但是处理速度非常快，花费的成本也更低	2049	2019年10月
ada	只能够处理非常简单的任务，通常来说在GPT-3系列的模型中它的成本是最低的处理速度也是最快的	2049	2019年10月

Codex

Codex模型现在已经被废弃掉了，他晚于GPT-3能够处理处理与生成代码。他的训练数据集包含自然语言以及GitHub上数亿行的开源代码。他对Python语言的处理效果最好，但是也精通包含JavaScript, Go, Perl, PHP, Ruby, Swift, TypeScript, SQL在内的10多种语言甚至也能很好地处理Shell脚本

模型	描述	最大Token	更新日期
code-davinci-002	Codex系列中能力最前的模型，尤其擅长根据提示词生成代码。除了能够生成代码还能够在代码中进行补全。	8001	2021年6月
code-davinci-001	略早于code-davinci-002版本	8001	2021年6月
code-cushman-002	能力与Davinci Codex几乎相当，但是处理速度更快。处理速度的优势使得他可能更适用于实时应用程序。	2048
code-cushman-001	略早于code-cushman-002版本	2048

模型接口

端点也可以理解成路径，这里采用的应该是Rest风格，每个端点后面对应的模型名称应该是这个端口所对应的模型能力支持

端点	模型名称
/v1/chat/completions	gpt-4, gpt-4-0314, gpt-4-32k, gpt-4-32k-0314, gpt-3.5-turbo, gpt-3.5-turbo-0301
/v1/completions	text-davinci-003, text-davinci-002, text-curie-001, text-babbage-001, text-ada-001, davinci, curie, babbage, ada
/v1/edits	text-davinci-edit-001, code-davinci-edit-001
/v1/audio/transcriptions	whisper-1
/v1/audio/translations	whisper-1
/v1/fine-tunes	davinci, curie, babbage, ada
/v1/embeddings	text-embedding-ada-002, text-search-ada-doc-001
/v1/moderations	text-moderation-stable, text-moderation-latest

列表中不包含first-generation Embedding以及DALL.E系列模型

随着gpt-3.5-turbo的发布，一些模型现在正在不断更新。为了避免更新过程中一些改变影响用户的使用体验，OpenAI也提供了一些三个月保持静态不更新的版本。随着模型更新的节奏，人们可以通过OpenAI Evals仓库来对模型进行反馈。帮助我们通过不通的用例来提高模型能力。以下模型是将在指定日期弃用的临时快照。如果您想使用最新的型号版本，请使用标准型号名称，如gpt-4或gpt-3.5-turbo：

模型名称	废弃日期
gpt-3.5-turbo-0301	2023年6月1日
gpt-4-0314	2023年6月14日
gpt-4-32k-0314	2023年6月14日

码涤生

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
OpenAI文档翻译——场景的模型以及差异

OpenAI API由一系列的不同价格不同能力的模型来提供服务。你也可以通过微调模型对原有模型进行一定的训练从而解决特定领域的一些问题。模型描述GPT-4基于GPT-3.5改进而来，可以更好的理解和生成文本内容或是代码GPT-3.5基于GPT-3改进而来，可以更好的理解和生成文本内容或是代码DALL.E可以根据提示词生成图像，并根据提示词上下文对生成的图像进行修改Whisper将引擎转换成文本Embeddings一组可以将文本转换成数字的模型Moderation。
复制链接

扫一扫