GPT o3大概会在1月底正式发布,但在此之前预热的为期12天的发布会,终于来了最后一波大招,直接将AGI上升到了一个新的高度。推出了其最新的推理模型o3,这是 o1 的后继者。
这波模型上线,对我们有什么影响?
1、为什么将新模型称为 o3,而不是 o2?
The Information 报道,OpenAI 跳过 o2 是为了避免与英国电信提供商 O2 发生潜在冲突。首席执行官 Sam Altman 在今天上午的直播中证实了这一点。
该模型系列包括标准版 o3 和紧凑版 o3 mini,也就是pro版和青春版。专为特定任务应用而设计。与传统的 AI 推理模型不同,它依赖于私有链思维到自我事实检查使其速度更慢,但是这也意味着在物理、数学和编程等领域更准确。也就是说,它是数学家,物理学家,和编程大师。
先上数据!
左边的是软件工程考试(SWE-Bench Verified),这就像是一个考写程序的考试,比如你写一个软件要它快速、准确,还不能有 bug(小错误)。这是考察 o3 是否能像一流的软件工程师一样写出完美的代码。
o3 的成绩:71.7%,比o1还强了不少,右边的那个基准比较猛,Codeforces,一个全球著名的编码竞赛平台。o3的得分是2727,这个得分,相当于整个榜单的第175名,已经超越了99.99%的人类了,我们可以从数据上,武断的说,它的编码能力,在这份榜单上,排名175
在发布会中,Open AI一直都在强调一个关键词----AGI
2、那么什么是AGI?
AGI 是“通用人工智能”的缩写,泛指能够执行人类所能完成的任何任务的人工智能。OpenAI 有自己的定义:“在最具经济价值的工作上表现优于人类的高度自主系统。”
实现 AGI 将是一个大胆的宣言。 从一项基准来看,OpenAI正在慢慢接近 AGI。在 ARC-AGI(一项旨在评估 AI 系统是否能够有效地在其训练数据之外获得新技能的测试)中,o3 在高计算设置下获得了 87.5% 的分数。在最差的情况下(在低计算设置下),该模型的性能是 o1 的三倍
简单来说就是,AGI 就是能做任何人类能做的事情的人工智能,不仅仅是解决特定问题或任务,而是可以处理任何未知或新的任务。
目前的大部分人工智能(比如聊天机器人、推荐系统、语音助手等)都属于“窄人工智能”(Narrow AI),它们只能在特定领域内表现得很好,比如只会下围棋、语音识别或玩游戏。AGI 则不同,它能够灵活地应对各种不同的挑战,不受限于某一个领域。
为了实现 AGI,AI 系统需要具备以下能力:
学习新知识 :就像人类不断学习新技能,AGI 也能通过新的经验和信息不断提升自己。
解决多种问题: 无论是数学、艺术、社交还是技术问题,AGI 都能应对自如。
自主行动 :AGI 需要能在复杂环境中做出决策,甚至有自我改进的能力。
OpenAI 发布首批推理模型后,包括谷歌在内的竞争对手 AI 公司纷纷推出了大量推理模型。11 月初,由量化交易员资助的 AI 研究公司 DeepSeek 发布了其首款推理模型 DeepSeek-R1的预览版。同月,阿里巴巴的 Qwen 团队 发布了 据称是 o1 的第一个“开放”挑战者(它可以下载、微调并在本地运行)。
打工人已经瑟瑟发抖了,人工智能太可怕了!!
人工智能的发展速度非常快,曾经看似未来主义的工具现在正成为人工智能发展的一部分,日常生活中,无论是通过固定电话、桌面应用程序还是消息平台, 开放人工智能和谷歌之间的竞争正在以前所未有的速度推动创新。
作为用户,我们是这场技术军备竞赛的受益者,o3 模型可能只是使人工智能更智能、更易于使人工智能更智能、更易于访问、更融入我们的生活,重要的是它只是一个工具。
我们要做的就是适应人工智能的发展,让AI融入我们的日常生活中,我日常办公已经离不开GPT了,它确实可以帮我做很多事情,提高了我的工作效率,而且我只是用的plus版的GPT共享账号,完全能够满足我的日常需求,pro版的对普通人来说还是太贵了,共享账号性价比更高,而且也没什么限制,但是在找平台的时候一定要找个靠谱的,比如familypro.io ,要不后续很麻烦,容易被封号,我就是在这买的,目前用着还不错,主要是比较实惠。
未来所有的行业肯定会被AI重塑一遍,所以我们越早一点熟悉AI,在未来被淘汰的概率就会小一点。