OpenAI于2024年12月20日发布了人工智能“推理”模型o3-mini,并于2025年2月1日在ChatGPT和API中正式上线。
人工智能 “推理” 模型是一类能够模拟人类推理过程,对输入信息进行分析、判断和决策的智能模型。
o3-mini模型会展开事实核查,可规避一些常见的模型陷阱,但会产生响应延迟,通常为几秒到几分钟。使用 “私人思想链” 进行 “思考”,能在响应前暂停,考虑相关提示并解释推理过程,最终总结出最准确的答案。可调整推理时间,有低、中、高三种计算级别,计算级别越高,任务执行性能越好。在软件工程能力测评中准确度得分 71.7%。在 2024 年 AIME 数学竞赛题目测试中准确度得分为 96.7%。以 100% 为最高分的 ARC-AGI 评估结果显示,最低成绩为 75.7%,最高成绩为 87.5%
一、技术原理
采用多层神经网络架构,融入变分自编码器思想,基于先进的生成对抗网络和深度学习算法构建,利用精细化自然语言处理技术,能更好地抓取上下文。
支持低、中、高三种推理强度选择。可根据任务需求调整,面对难题时能“更努力思考”,需要效率时优先考虑回应速度。
1.架构基础
- 多层神经网络:采用多层神经网络架构,能够对输入数据进行多层次的特征提取和抽象。可以自动学习数据中的复杂模式和关系,从底层的简单特征逐步组合成高层的语义特征,以实现对自然语言等数据的深入理解和处理。
- 变分自编码器思想融入:结合了变分自编码器的思想