2024年1月25日,就在刚刚,OpenAI推出了新一代的embedding模型,新的GPT-4 Turbo和moderation模型,新的API使用管理工具,并且很快会降低GPT-3.5 Turbo的价格。主要更新包括:
发布新型嵌入模型:OpenAI推出了两款全新的嵌入模型,旨在提高文本处理和理解的效率和准确性。
更新GPT-4 Turbo预览模型:这个新版本的GPT-4 Turbo模型包含了更加精准和高效的功能,增强了代码生成等任务的处理能力。
更新GPT-3.5 Turbo模型:这个升级版的GPT-3.5 Turbo模型不仅在性能上有所提升,而且价格也降低,以帮助开发者更加容易地扩展其应用。
更新文本审查模型:这个新版本的文本审查模型更加健壮,能更有效地识别并处理可能有害的内容。
新的嵌入模型与更低定价
OpenAI引入了两款新的嵌入模型:一款体积更小、效率更高的text-embedding-3-small
模型,以及一款更大、更强大的text-embedding-3-large
模型。
嵌入是表示内容中概念的数字序列,例如自然语言或代码。嵌入使机器学习模型和其他算法更容易理解内容之间的关系,并执行像聚类或检索等任务。它们支持ChatGPT和助理API中的知识检索,以及许多检索增强生成(RAG)开发者工具。
新的小型文本嵌入模型
text-embedding-3-small
是OpenAI的新高效嵌入模型,相较于2022年12月发布的前代模型text-embedding-ada-002
有显著提升。
更强的性能:在多语言检索常用基准(MIRACL)上,与text-embedding-ada-002
相比,text-embedding-3-small
的平均得分从31.4%提升至44.0%,而在英语任务常用基准(MTEB)上,平均得分从61.0%提升至62.3%。
降低价格:text-embedding-3-small
的效率也显著高于前代模型text-embedding-ada-002
。因此,text-embedding-3-small
的定价相较于text-embedding-ada-002
降低了5倍,从每千个标记的降至0.00002。
OpenAI不会废弃text-embedding-ada-002
,所以虽然OpenAI推荐新模型,但客户仍可继续使用前代模型。
新的大型文本嵌入模型:text-embedding-3-large
text-embedding-3-large
是OpenAI的新一代大型嵌入模型,可以创建多达3072维的嵌入。
更强的性能:text-embedding-3-large
是OpenAI目前性能最佳的模型。与text-embedding-ada-002
相比,在MIRACL上,平均得分从31.4%提升至54.9%,而在MTEB上,平均得分从61.0%提升至64.6%。
评估基准 | ada v2 | text-embedding-3-small | text-embedding-3-large |
---|---|---|---|
MIRACL平均 | 31.4 | 44.0 | 54.9 |
MTEB平均 | 61.0 | 62.3 | 64.6 |
text-embedding-3-large
的定价为每千个标记$0.00013。
您可以在OpenAI的嵌入指南中了解更多关于使用新嵌入模型的信息。
原生支持缩短嵌入
使用较大的嵌入,例如在向量存储中存储以供检索,通常比使用较小的嵌入花费更多,并且消耗更多的计算、内存和存储。
OpenAI的两个新嵌入模型均采用了一种技术,允许开发者在使用嵌入的性能和成本之间进行权衡。具体来说,开发者可以通过传入维度API参数来缩短嵌入(即从序列末尾移除一些数字),而不会使嵌入丧失其表示概念的属性。例如,在MTEB基准上,text-embedding-3-large
的嵌入可以缩短至256维,同时仍然优于未缩短的1536维的text-embedding-ada-002
嵌入。
ada v2 | text-embedding-3-small | text-embedding-3-large |
---|---|---|
嵌入大小 | 1536 | 512 |
平均MTEB得分 | 61.0 | 61.6 |
这使得使用非常灵活。例如,当使用只支持最多1024维嵌入的向量数据存储时,开发者现在仍然可以使用OpenAI最佳的嵌入模型text-embedding-3-large
,并为维度API参数指定1024的值,这将把嵌入从3072维缩短,以换取较小的向量尺寸但牺牲一些准确性。
其他新模型和降价
更新的GPT-3.5 Turbo模型和降价
下周OpenAI将推出一款新的GPT-3.5 Turbo模型,gpt-3.5-turbo-0125,并且是过去一年中第三次降低GPT-3.5 Turbo的价格,以帮助OpenAI的客户扩大规模。新模型的输入价格降低了50%,至每千个标记,输出价格降低了0.0015。这个模型还包括了各种改进,包括在请求格式的响应上更高的准确性,以及修复了一个导致非英语语言函数调用时文本编码问题的错误。
使用固定的gpt-3.5-turbo模型别名的客户将在此模型推出两周后自动升级从gpt-3.5-turbo-0613到gpt-3.5-turbo-0125。
更新的GPT-4 Turbo预览
自GPT-4 Turbo发布以来,超过70%的GPT-4 API客户请求已经转移到GPT-4 Turbo,因为开发者们利用了它更新的知识截止点、更大的128k上下文窗口和更低的价格。
今天,OpenAI正在发布一个更新的GPT-4 Turbo预览模型,gpt-4-0125-preview。与之前的预览模型相比,这个模型在完成任务(如代码生成)方面更为彻底,并旨在减少模型未能完成任务的“懒惰”案例。新模型还包括了一个影响非英语UTF-8生成的错误的修复。
对于那些希望自动升级到新的GPT-4 Turbo预览版本的用户,OpenAI还引入了一个新的gpt-4-turbo-preview模型名称别名,它将始终指向OpenAI最新的GPT-4 Turbo预览模型。
OpenAI计划在未来几个月内推出具有视觉功能的GPT-4 Turbo普遍可用。
更新的内容审核模型
免费的内容审核API允许开发者识别潜在的有害文本。作为OpenAI持续安全工作的一部分,OpenAI正在发布text-moderation-007,这是OpenAI迄今为止最强大的内容审核模型。text-moderation-latest和text-moderation-stable别名已更新指向它。您可以通过OpenAI的安全最佳实践指南了解更多关于构建安全AI系统的信息。
理解API使用情况和管理API密钥的新方法
OpenAI正在推出两项平台改进,以便开发者更清晰地了解其使用情况,并对API密钥进行更多控制。
首先,开发者现在可以从API密钥页面为API密钥分配权限。例如,一个密钥可以被分配为只读访问权限,以供力一个内部追踪仪表板使用,或限制为仅访问特定端点。
其次,在打开追踪后,使用仪表板和使用出口功能现在会在API密钥级别公开指标。这使得通过为每个功能、团队、产品或项目设置不同的API密钥,简单地查看各自的使用情况变得容易。
看未来
随着AI技术的不断进步,未来的可能性变得更加广阔和令人兴奋。你认为AI在哪些领域还有潜力未被挖掘?你期待AI在未来的哪些方面与我们的生活更紧密结合?请通过公众号留言交流你的想法,让我们一起探讨AI带给我们的无限可能。
推荐阅读
-
最新消息,GPT-5终于要来了!比尔盖茨专访OpenAI CEO山姆奥特曼: 揭示GPT-5神秘面纱【附音频原文和访谈文稿】
-
AI Weekly『1月15-21日』: OpenAI筹集资金建造AI芯片工厂;马斯克加码AI投资,共投入110亿美金;微软推出Copilot Pro;2024年CES大会人工智能主导
欢迎关注我的公众号“AI信息Gap”,原创技术文章第一时间推送。