OpenAI现已普遍提供带有视觉应用程序接口的GPT-4 Turbo

OpenAI发布了GPT-4TurbowithVision的全面API,提升了速度和输入上下文,允许开发者通过JSON和函数调用实现高级语言和视觉功能。初创公司如Cognition和TLDraw已开始应用,这将助OpenAI稳固企业在企业市场中的地位。
摘要由CSDN通过智能技术生成

OpenAI宣布,其功能强大的GPT-4 Turbo with Vision模型现已通过公司的API全面推出,为企业和开发人员将高级语言和视觉功能集成到其应用程序中开辟了新的机会。 PS:使用Wildcard享受不受网络限制的API调用,详情查看教程

继去年 9 月首次发布 GPT-4 的视觉和音频上传功能,以及 11 月在 OpenAI 开发者大会上发布 GPT-4 Turbo 涡轮增压模型之后,GPT-4 Turbo with Vision 也在 API 上推出。

GPT-4 Turbo 可显著提高速度,扩大输入上下文窗口,最多可容纳 128,000 个令牌(相当于约 300 页),并提高开发人员的经济承受能力。

一个关键的增强功能是 API 请求能够通过文本格式 JSON 和函数调用利用模型的视觉识别和分析功能。这样,开发人员就可以生成 JSON 代码片段,在连接的应用程序中自动执行操作,如发送电子邮件、购物或在线发布。不过,OpenAI 强烈建议在采取影响现实世界的行动之前,先建立用户确认流程。

一些初创公司已经在利用 Vision 的 GPT-4 Turbo,其中包括Cognition,该公司的人工智能编码代理 Devin 依靠该模型自动生成完整代码:

image-20240412163112313

Healthify是一款健康和健身应用程序,它利用该模型根据膳食照片提供营养分析和建议:

image-20240412163133819

TLDraw 是一家位于英国的初创公司,它采用 GPT-4 Turbo with Vision 为其虚拟白板提供动力,并将用户绘制的图纸转换为功能网站:

image-20240412163151022

尽管面临着 Anthropic 的 Claude 3 Opus 和谷歌的 Gemini Advanced 等较新模型的激烈竞争,但随着开发人员等待 OpenAI 的下一个大型语言模型,API 的发布应有助于巩固 OpenAI 在企业市场的地位。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值