OpenAI 宣布推出o3模型, AGI 是否已在眼前?

想象一下这样一个世界: AI不仅能理解人类的推理,还能模仿人类的推理,像人脑一样无缝地解决问题。随着 OpenAI 宣布其最新的突破性 AI 模型O3,这一愿景离现实更近了一步。可以说,这是迈向超级智能领域的一次飞跃。下面就跟着小编来看一下o3模型的非凡之处吧~

12 月 20 日,OpenAI宣布推出 o3 系列模型,引发了行业的强烈震动。o3 是 OpenAI 年早些时候发布的 o1 模型后续型号,标语是“更接近 AGI”(通用人工智能)

【图片来源于网络,侵删】

o3的能力,对现在所有模型,几乎是降维打击。

首先,o3相比o1最突出的成绩,一是在顶尖程序员竞赛CodeForces中,分数超过2700,人类超过这个分数的目前只有不到200个,而 O1 的评分仅为 1891。o3完全粉碎了满血版o1! 

【图片来源于网络,侵删】

在第二项测试 — ARC-AGI 中,o3 分数达到恐怖的 87.5%,超越过去所有模型!o1 的得分在 25% 到 32% 之间,o3 的最低成绩为 75.7%,最高成绩为 87.5%,超过了标志着达到人类水平的门槛 85%。

【图片来源于网络,侵删】

科普一下:ARC-AGI是一个评估人工通用智能抽象推理能力的挑战赛,旨在让AI展示一种具有基本推理能力的通用智能。

另一项测试是号称最难数学测试的EpochAI Frontier Math。在今年11月Epoch AI发布的数学基准Frontier Math上,o3准确率高达25.2%。 

【图片来源于网络,侵删】

要知道,此前陶哲轩可认为这项测试能难住AI好几年。

o3这么牛,是不是已经实现了AGI?

尽管o3创造了记录,成为首个突破 ARC-AGI 基准测试的 AI 模型,但仍有不少人表示这并不代表o3实现了AGI。

ARC-AGI挑战赛组织者明确表示,他们不认为超越这个比赛基准是实现 AGI 的指标。

ARC 挑战赛组织者 Mike Knoop 在X社交媒体帖子中表示,即使 OpenAI 投入大量计算能力来计算非正式分数,o3 模型也未能解决 100 多个视觉拼图任务。

虽然 o3 并没有完全实现AGI,但正如它的标语“更接近AGI”,AGI的山顶,o3了一大步

因此,小编认为随着 O3 的发布,2025 年有望成为人工智能具有里程碑意义的一年。

人工智能高速发展将带来算力需求增加

在o3系列模型的发布之前,OpenAI 就曾暗示将开发自主代理“operator”。

这意味着AI能在没有人工干预的情况下管理复杂任务的系统,并有望彻底改变从医疗保健和金融到创意领域的各行各业,实现无数工作流程的自动化并重新定义生产力。

这些进步也将促使更多企业布局智算中心,推动相关产业链发展,以满足日益增长的算力需求。

同时,随着 o3 及 o3-mini 的发布,小编相信未来国内也会有更多的开源计划而算力也将成为推动关键技术开发的重要支撑。

大家对这个新领域有什么看法?欢迎在评论区交流讨论哦~

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值