OpenAl 最新发布的 o3 模型有多强大？对我们有什么影响？

最新推荐文章于 2025-05-03 08:14:32 发布

Erica_zhase

最新推荐文章于 2025-05-03 08:14:32 发布

阅读量1.1k

点赞数 14

文章标签： chatgpt 学习 ai 人工智能 java python c语言

本文链接：https://blog.csdn.net/Erica_zhase/article/details/144694357

版权

GPT o3大概会在1月底正式发布，但在此之前预热的为期12天的发布会，终于来了最后一波大招，直接将AGI上升到了一个新的高度。推出了其最新的推理模型o3，这是 o1 的后继者。

这波模型上线，对我们有什么影响?

1、为什么将新模型称为 o3，而不是 o2？

The Information 报道，OpenAI 跳过 o2 是为了避免与英国电信提供商 O2 发生潜在冲突。首席执行官 Sam Altman 在今天上午的直播中证实了这一点。

该模型系列包括标准版 o3 和紧凑版 o3 mini，也就是pro版和青春版。专为特定任务应用而设计。与传统的 AI 推理模型不同，它依赖于私有链思维到自我事实检查使其速度更慢，但是这也意味着在物理、数学和编程等领域更准确。也就是说，它是数学家，物理学家，和编程大师。

先上数据！

左边的是软件工程考试（SWE-Bench Verified），这就像是一个考写程序的考试，比如你写一个软件要它快速、准确，还不能有 bug（小错误）。这是考察 o3 是否能像一流的软件工程师一样写出完美的代码。

o3 的成绩：71.7%，比o1还强了不少，右边的那个基准比较猛，Codeforces，一个全球著名的编码竞赛平台。o3的得分是2727，这个得分，相当于整个榜单的第175名，已经超越了99.99%的人类了，我们可以从数据上，武断的说，它的编码能力，在这份榜单上，排名175

在发布会中，Open AI一直都在强调一个关键词----AGI

2、那么什么是AGI？

AGI 是“通用人工智能”的缩写，泛指能够执行人类所能完成的任何任务的人工智能。OpenAI 有自己的定义：“在最具经济价值的工作上表现优于人类的高度自主系统。”

实现 AGI 将是一个大胆的宣言。从一项基准来看，OpenAI正在慢慢接近 AGI。在 ARC-AGI（一项旨在评估 AI 系统是否能够有效地在其训练数据之外获得新技能的测试）中，o3 在高计算设置下获得了 87.5% 的分数。在最差的情况下（在低计算设置下），该模型的性能是 o1 的三倍

简单来说就是，AGI 就是能做任何人类能做的事情的人工智能，不仅仅是解决特定问题或任务，而是可以处理任何未知或新的任务。

目前的大部分人工智能（比如聊天机器人、推荐系统、语音助手等）都属于“窄人工智能”（Narrow AI），它们只能在特定领域内表现得很好，比如只会下围棋、语音识别或玩游戏。AGI 则不同，它能够灵活地应对各种不同的挑战，不受限于某一个领域。

为了实现 AGI，AI 系统需要具备以下能力：

学习新知识：就像人类不断学习新技能，AGI 也能通过新的经验和信息不断提升自己。

解决多种问题：无论是数学、艺术、社交还是技术问题，AGI 都能应对自如。

自主行动：AGI 需要能在复杂环境中做出决策，甚至有自我改进的能力。

OpenAI 发布首批推理模型后，包括谷歌在内的竞争对手 AI 公司纷纷推出了大量推理模型。11 月初，由量化交易员资助的 AI 研究公司 DeepSeek 发布了其首款推理模型 DeepSeek-R1的预览版。同月，阿里巴巴的 Qwen 团队发布了据称是 o1 的第一个“开放”挑战者（它可以下载、微调并在本地运行）。

打工人已经瑟瑟发抖了，人工智能太可怕了！！

人工智能的发展速度非常快，曾经看似未来主义的工具现在正成为人工智能发展的一部分，日常生活中，无论是通过固定电话、桌面应用程序还是消息平台，开放人工智能和谷歌之间的竞争正在以前所未有的速度推动创新。

作为用户，我们是这场技术军备竞赛的受益者，o3 模型可能只是使人工智能更智能、更易于使人工智能更智能、更易于访问、更融入我们的生活，重要的是它只是一个工具。

我们要做的就是适应人工智能的发展，让AI融入我们的日常生活中，我日常办公已经离不开GPT了，它确实可以帮我做很多事情，提高了我的工作效率，而且我只是用的plus版的GPT共享账号，完全能够满足我的日常需求，pro版的对普通人来说还是太贵了，共享账号性价比更高，而且也没什么限制，但是在找平台的时候一定要找个靠谱的，比如familypro.io ，要不后续很麻烦，容易被封号，我就是在这买的，目前用着还不错，主要是比较实惠。