刚刚,OpenAI最强编程智能体上线ChatGPT

 Datawhale热点 

最新发布:OpenAI,整理:Datawhale

编辑|新智元

从今天起,AI编程正式开启新时代!

刚刚,Greg Brockman带队与OpenAI六人团队开启线上直播,震撼发布了一款云端AI编程智能体——Codex。

用奥特曼的话来说就是,一个人就能打造无数软件的时代来了!

Codex由新模型codex-1加持,这是o3的一个特调版本,专为软件工程量身打造。

它不仅能在云端沙盒环境中安全地并行处理多项任务,而且通过与GitHub无缝集成,还可以直接调用你的代码库。

它不仅仅是一款工具,更是一位「10x工程师」,能够同时做到:

  • 快速构建功能模块

  • 深入解答代码库问题

  • 精准修复代码漏洞

  • 提交PR

  • 自动执行测试验证

过去,这些任务或许耗费开发者数小时乃至数日,如今Codex最多在30分钟内高效完成。

点击ChatGPT侧边栏,输入提示后,直接点击「代码」分配任务,或「提问」咨询代码库相关问题

通过强化学习,Codex基于真实世界的编码任务和多样化环境训练,生成的代码不仅符合人类偏好,还能无缝融入标准工作流。

今天起,Codex将向全球ChatGPT Pro、Enterprise和Team用户正式开放,Plus和Edu用户很快就能上手了。

Codex多任务并行,AI编程超级加速器

早在2021年,OpenAI首次发布了CodeX模型,开启了「氛围编程」(vibe coding)的时代。

这种编程方式让开发者与AI协同工作,代码生产变得更加直观、高效。

几周前,OpenAI又推出了CodeX CLI,一款可在本地终端运行的智能体。

但这只是开始!

OpenAI今天推出全新的Codex智能体,再次将软件工程推向一个全新的高度。

接下来,一睹Codex编码的惊艳表现吧。

连接GitHub账户后,OpenAI研究员Thibault Sottiaux选择了一个开源仓库preparedness repo。

然后,他收到了三个任务:

  • 第一个是提问:让代码智能体Codex解释代码库,说明整体结构

  • 第二个是代码任务:要求在代码库中查找并修复某个地方bug

  • 第三个任务是提问:遍历代码库,主动提出自己可以执行的任务建议

接下来演示中,Thibault向Codex下达多个任务,比如拼写和语法纠错、智能任务委派、多仓库适配。

在纠错方面,他故意在指令中加入拼写错误,Codex不仅理解了意图,还主动找出了代码库中的拼写和语法问题并修复,细致到令人惊叹。

当Thibault提出希望代码库「易维护、无bug」的目标时,Codex遍历代码库后,主动发现了可变默认值、不一致的超时设置等问题,并自行生成了修复任务。

这种「自我委派」能力,堪称智能体的巅峰表现。

值得注意的是,Codex智能体运行在OpenAI计算基础设施上,与强化学习共享同一套久经考验的系统。

每个任务都在独立的虚拟沙盒中运行,配备专属的文件系统、CPU、内存、和网络策略,确保了高效安全。

除了preparedness仓库,Codex还无缝处理了CodeX CLI库,展现其在不同项目中的泛化能力。

不论是开源项目,还是内部代码库,Codex都游刃有余。

Codex接收到了用户反馈的bug,因为特殊字符文件名导致了diff命令报错。

在解决过程中,它不仅能复现问题,还可以编写测试脚本、运行linter检查,并生成PR,整个过程仅需几分钟。

Thibault直言,「这原本可能花费我30分钟,甚至几个小时完成」。

此外,OpenAI研究员Katy Shi演示中强调,Codex的PR包含了详细的摘要,清晰说明了修改内容和引用的代码,测试结果一目了然。

对齐人类偏好,对比o3效果

OpenAI训练codex-1的一个主要目标,是确保其输出能高度符合人类的编码偏好与标准。

与OpenAI o3相比,codex-1能稳定生成更为简洁的代码修改补丁,可以直接供人工审查并集成到标准工作流程中。

Codex 与 o3 对比:

OpenAI 表示,Codex 智能体完全运行于云端的安全隔离容器中。任务执行期间将禁用互联网访问,确保智能体仅能交互以下内容:通过 GitHub 仓库明确提供的代码、用户通过设置脚本配置的预安装依赖项以及该智能体无法访问任何外部网站、API 或其他服务。

Codex的定价贵不贵

在接下来的几周内,所有用户可以「量大管饱」的试用Codex功能。

随后,OpenAI将引入限流机制和灵活定价,支持按需购买额外使用量。

对于开发者,codex-mini-latest模型已在Responses API上提供,价格为:

  • 每百万输入Token:$1.50

  • 每百万输出Token:$6.00

  • 并享有75%的提示缓存折扣

此外,OpenAI 表示,Codex当前仍处于研究预览阶段,尚不支持图像输入等前端能力,也暂不具备在任务执行中进行实时纠正的能力。

同时,委派任务给Codex智能体的响应时间较长,用户可能需要适应这类异步协作的工作方式。

最后,OpenAI 表示,未来计划将进一步提升智能体工作流的交互性和灵活性:

  • 支持任务中途提供指导

  • 与AI协作实施策略

  • 接收主动进度更新

  • 与常用工具(如GitHub、CLI、问题跟踪器、CI系统)深度集成,便捷分配任务

未来,编程真的会变得越来越简单。

而当技术门槛消融,创造力便成为唯一的边界。

参考资料:

https://www.youtube.com/watch?v=hhdpnbfH6NU

https://openai.com/index/introducing-codex/

图片

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值