OpenAI发布最强推理模型o1，大模型升级版来了

AGI大模型老王

于 2024-09-13 10:23:57 发布

阅读量319

点赞数 3

文章标签：人工智能 chatgpt 大模型教程大模型学习大模型入门 AI大模型大模型

本文链接：https://blog.csdn.net/2401_85390073/article/details/142203697

版权

北京时间9月13日凌晨，美国OpenAI公司发布全新模型技术产品o1，包括两种版本o1-preview 和 o1-mini，前者具有高级推理功能，在推理数学、编程、科学等问题的能力上有显著提高，性能接近理化生博士水平；后者则是一款更小巧、专为代码生成优化的模型。

这就是此前传言中高级推理能力强大模型的“Strawberry”项目。也有人分析称，o1是Orion大模型简称。

OpenAI表示，对于复杂推理任务而言，新模型代表着 AI 能力的崭新水平，因此值得将计数重置为1，给它一个有别于“GPT-4”系列的全新名号。同时，这也预示着，AI时代迎来崭新的起点——能够进行通用复杂推理的大模型重要到来。

需要注意的是，o1 目前的聊天体验还比较基础。不同于其前身 GPT-4o，o1 目前无法浏览网页或处理文件分析功能。尽管它具备图像分析功能，但该功能暂时关闭，等待进一步测试。此外，o1 还有消息量限制——目前 o1-preview 每周限额30条、o1-mini每周50条。

即日起，o1-preview 和 o1-mini两个版本已经在ChatGPT Plus/Team和API接口渠道上线，企业和教育用户将于下周初获得优先访问权限。

OpenAI CEO奥尔特曼（Sam Altman）表示，“这是我们迄今为止功能最强大、最一致的模型系列 o1，也是迄今为止我们最好的推理模型。虽然o1仍然存在缺陷并有限，但使用时的感觉依然更加令人印象深刻。”

具体来看，OpenAI o1可以解决比以前GPT时期的科学、编码和数学模型更难的问题。

OpenAI的研究负责人Jerry Tworek透露，o1模型背后的训练与之前的产品有着根本性的区别。之前的GPT模型旨在模仿其训练数据中的模式，而o1的训练旨在让其独立解决问题。在强化学习的过程中，使用奖励和惩罚机制来“教育”AI使用“思维链”来处理问题，就像人类习得拆解、分析问题的方式一样。

o1上线之后，现在ChatGPT可以在回答问题前先仔细思考，而不是立即脱口而出答案。就像人类大脑的系统 1 和系统 2，ChatGPT 已经从仅使用系统 1（快速、自动、直观、易出错）进化到了可使用系统 2 思维（缓慢、深思熟虑、有意识、可靠）。这让它能够解决以前无法解决的问题。

所谓推理大模型，就是AI会在回答之前花更多时间进行思考，就像人类思考解决问题的过程一样，而非预测单词生成的序列。比如通过文字点开AI思考的过程，还会出现AI表示“我在思考这个事情这么做行不行”、“啊时间不够了得尽快给出答案”等。OpenAI确认，这里展示的并不是原始的思维链，而是“模型生成的摘要”，公司也坦率承认这里有保持“竞争优势”的因素。

根据测试，在国际数学奥林匹克（IMO）资格考试中，GPT-4o 仅正确解答了 13% 的问题，而 o1 模型正确解答了 83% 的问题。而在编程能力比赛Codeforces中，o1模型拿到89%百分位的成绩，而GPT-4o只有11%。

OpenAI 发现，随着更多的强化学习（训练时计算）和更多的思考时间（测试时计算），o1 的性能持续提高。而且扩展这种方法的限制与大模型预训练的限制有很大不同，OpenAI 也还在继续研究。

OpenAI技术文件称，实验结果表明：o1 超越了人类专家的表现，性能接近理科博士水平，成为第一个在该基准测试中做到这一点的模型。而在下一个更新的版本中，AI在物理、化学和生物学的挑战性基准测试中，表现能够与博士生水平类似。

除了OpenAI o1-preview外，OpenAI今晨也同步推出了o1-mini模型，更快、更便宜，定价也比preview版本降低了80%，适用于需要推理但不需要广泛世界知识的场景。

很显然，尽管新的OpenAI o1还不具备更全面问题解决能力，但显著提升的推理能力使其在科学、编程、数学等专业领域具备了更大的用途，以及 AI Agent 相关技术的下限和上限被整体拉高，大幅提升科学研究和生产端的能力，对于消费端来说意义不算太大。

英伟达首席科学家Jim Fan表示，新的o1需要消耗更大的算力和数据，并且能够形成数据飞轮效应，正确的答案及其思考过程可以成为很好的训练数据。从而不断改进推理核心，类似AlphaGo的价值网络随着MCTS生成更多精炼数据而改进。

天风国际称，OpenAI o1系列模型大幅增强推理能力，并宣布新的Scaling范式：通过RL解锁Test time compute（推理时间）。

大模型&AI产品经理如何学习

求大家的点赞和收藏，我花2万买的大模型学习资料免费共享给你们，来看看有哪些东西。

1.学习路线图

第一阶段：从大模型系统设计入手，讲解大模型的主要方法；

第二阶段：在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用；

第三阶段：大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统；

第四阶段：大模型知识库应用开发以LangChain框架为例，构建物流行业咨询智能问答系统；

第五阶段：大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型；

第六阶段：以SD多模态大模型为主，搭建了文生图小程序案例；

第七阶段：以大模型平台应用与开发为主，通过星火大模型，文心大模型等成熟大模型构建大模型行业应用。

2.视频教程

网上虽然也有很多的学习资源，但基本上都残缺不全的，这是我自己整理的大模型视频教程，上面路线图的每一个知识点，我都有配套的视频讲解。

（都打包成一块的了，不能一一展开，总共300多集）

因篇幅有限，仅展示部分资料，需要点击下方图片前往获取

3.技术文档和电子书

这里主要整理了大模型相关PDF书籍、行业报告、文档，有几百本，都是目前行业最新的。

4.LLM面试题和面经合集

这里主要整理了行业目前最新的大模型面试题和各种大厂offer面经合集。

👉学会后的收获：👈
• 基于大模型全栈工程实现（前端、后端、产品经理、设计、数据分析等），通过这门课可获得不同能力；

• 能够利用大模型解决相关实际项目需求：大数据时代，越来越多的企业和机构需要处理海量数据，利用大模型技术可以更好地处理这些数据，提高数据分析和决策的准确性。因此，掌握大模型应用开发技能，可以让程序员更好地应对实际项目需求；

• 基于大模型和企业数据AI应用开发，实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能，学会Fine-tuning垂直训练大模型（数据准备、数据蒸馏、大模型部署）一站式掌握；

• 能够完成时下热门大模型垂直领域模型训练能力，提高程序员的编码能力：大模型应用开发需要掌握机器学习算法、深度学习框架等技术，这些技术的掌握可以提高程序员的编码能力和分析能力，让程序员更加熟练地编写高质量的代码。

1.AI大模型学习路线图
2.100套AI大模型商业化落地方案
3.100集大模型视频教程
4.200本大模型PDF书籍
5.LLM面试题合集
6.AI产品经理资源合集***

👉获取方式：
😝有需要的小伙伴，可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

AGI大模型老王

关注

3
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
OpenAI发布最强推理模型o1，大模型升级版来了

北京时间9月13日凌晨，美国OpenAI公司发布全新模型技术产品o1，包括两种版本o1-preview 和 o1-mini，前者具有高级推理功能，在推理数学、编程、科学等问题的能力上有显著提高，性能接近理化生博士水平；后者则是一款更小巧、专为代码生成优化的模型。OpenAI表示，对于复杂推理任务而言，新模型代表着 AI 能力的崭新水平，因此值得将计数重置为1，给它一个有别于“GPT-4”系列的全新名号。同时，这也预示着，AI时代迎来崭新的起点——能够进行通用复杂推理的大模型重要到来。
复制链接

扫一扫