OpenAI正式推出了全新的o1-preview系列，专注于解决复杂问题

新加坡内哥谈技术

于 2024-09-13 07:33:19 发布

阅读量298

点赞数 5

文章标签：人工智能语言模型自然语言处理 chatgpt

本文链接：https://blog.csdn.net/2301_79342058/article/details/142192356

版权

每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/

OpenAI正式推出了全新的o1-preview系列，专注于解决复杂问题，并于9月12日开始提供。新模型在科学、编程和数学领域表现出色，能够应对比以往更难的任务。

这一系列的AI模型经过特别训练，在回答问题前会花更多时间进行思考。它们可以像人类一样，推理复杂任务并解决难题。这次的发布仅是预览版，未来会不断推出更新和改进。同时，正在开发中的下一个版本也在进行评估。

这些模型的工作原理类似于人类解决问题的思维方式，通过训练，它们学会优化思考过程，尝试不同的策略，并能认识到自己的错误。在测试中，下一版本的模型在物理、化学和生物等高难度基准任务中的表现类似于博士生。在国际数学奥林匹克（IMO）的模拟考试中，GPT-4o仅解决了13%的问题，而这个新模型的得分达到了83%。在编程能力的评估中，新模型在Codeforces竞赛中达到了89%的水平。详细信息可在技术研究报告中查看。

虽然这个早期模型暂时没有像ChatGPT一样的功能，比如浏览网页或上传文件和图片，但在复杂推理任务方面，这无疑是AI能力的一次重大飞跃。因此，OpenAI将这一系列重新命名为o1，并将计数器重置为1。

在安全方面，OpenAI采用了新的安全训练方法，利用这些模型的推理能力，使其更加遵守安全和对齐准则。通过推理安全规则，它们能够更有效地应用这些规定。在一个严苛的绕过安全测试中，GPT-4o的得分仅为22（满分100），而o1-preview模型的得分达到了84。详细信息可在系统卡片和研究报告中阅读。

为匹配新模型的能力，OpenAI加强了安全工作，包括与联邦政府的合作，采用了最佳的红队测试和董事会级别的审查流程。此外，OpenAI还与美国和英国的AI安全研究所签订了正式协议，并为这些机构提供了研究版模型的早期访问权限，以便为未来模型的研究、评估和测试建立流程。

这些新模型的推理能力对于解决科学、编程、数学等领域的复杂问题尤为有用。例如，o1可以帮助医疗研究人员注释细胞测序数据，帮助物理学家生成量子光学所需的复杂数学公式，并为各领域的开发者构建和执行多步骤工作流程。

新加坡内哥谈技术

关注

5
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
OpenAI正式推出了全新的o1-preview系列，专注于解决复杂问题

这些模型的工作原理类似于人类解决问题的思维方式，通过训练，它们学会优化思考过程，尝试不同的策略，并能认识到自己的错误。点击订阅，与未来同行！在安全方面，OpenAI采用了新的安全训练方法，利用这些模型的推理能力，使其更加遵守安全和对齐准则。为匹配新模型的能力，OpenAI加强了安全工作，包括与联邦政府的合作，采用了最佳的红队测试和董事会级别的审查流程。此外，OpenAI还与美国和英国的AI安全研究所签订了正式协议，并为这些机构提供了研究版模型的早期访问权限，以便为未来模型的研究、评估和测试建立流程。
复制链接

扫一扫