时间12月5日,OpenAI正式上线ChatGPT的o1和o1 - Pro两个新的AI模型。其中o1模型实际上大家之前已经用过了,只是那时候还叫o1 - preview,仅开放了o1模型的部分功能。现在,满血版的o1模型不仅支持文本输入,还新增了图像和文件上传的多模态能力,尽管遗憾的是,网页搜索功能依然未上线。OpenAI CEO萨姆·奥特曼通过柱状图展示了o1模型的性能提升:在数学推理和编程领域的表现提升了约50%,而在科研领域的提升有限。
o1 - Pro模型则是这次更新的重头戏,订阅费用高达200美元,成为目前市场上最昂贵的个人用户订阅服务。o1 - Pro在处理博士级别的科学问题时,准确率提升至79.3%,而解答美国数学竞赛试题的准确率则达到了85.8%。虽然o1 - Pro在性能上略有提升,但对于普通用户而言,o1模型已足以满足日常需求。对于那些需要频繁使用AI的小型企业或科研人员来说,高阶功能的开启或许是值得考虑的。
核心性能参数对比
在核心性能参数方面,o1和o1 - Pro模型存在一定差异。o1模型相较于之前的预览版,错误率减少了34%,思考速度提升了50%,在解答美国数学竞赛试题时准确率从56.7%提升到83.3%。而o1 - Pro模型性能更为突出,在数学方面是o1 - preview的一倍,代码是其2倍,在处理博士级别的科学问题时,准确率提升至79.3%,解答美国数学竞赛试题的准确率则达到了85.8%。
实际应用场景差异
实际应用场景方面,o1和o1 - Pro模型存在一定差异。
o1模型凭借其新增的多模态能力,支持图片和文件上传,在一些需要结合图像和文本信息进行处理的场景中具有应用潜力。例如,对于科研人员来说,当他们通过手绘草图和相关问题输入o1模型时,可以得到关于太空数据中心散热设计等专业问题的详细解答。然而,o1在解析图形问题上也显示出一定局限性,如在实测中未能准确判断集合数量导致答案错误。在解答简单数学题时,o1虽然能给出正确答案,但与Kimi和文心一言相比,其推导过程更为详细,这在科研应用场景中对需要验证推理过程的用户是重要优势。在编程能力测试中,o1模型展现出更系统的解答思路,不仅给出代码实现方案,还详细分析了实现的逻辑和步骤。
o1 - Pro模型主要面向对AI性能有更高要求的用户。其在处理博士级别的科学问题时准确率提升至79.3%,解答美国数学竞赛试题的准确率达到85.8%。对于那些需要频繁使用AI进行高精度科研工作的小型企业或科研人员来说,o1 - Pro的高阶功能可能更符合他们的需求。但考虑到其高昂的订阅费用(每月200美元),普通用户可能不会选择。
用户体验及反馈
从用户体验及反馈的角度来看,o1模型的升级受到了广泛关注。其新增的图像和文件上传的多模态能力,为用户提供了更丰富的交互方式。然而,网页搜索功能的缺失也引发了一些用户的不满。对于o1 - Pro模型,虽然其在处理高难度问题上的准确率有显著提升,但昂贵的订阅费用让许多普通用户望而却步。一些科研人员和小型企业用户表示,o1 - Pro的高阶功能在处理专业问题时具有一定优势,但对于大多数日常使用场景,o1模型已经能够满足需求。总体而言,用户对于这两个模型的评价褒贬不一,未来OpenAI可能需要根据用户反馈进一步优化模型的性能和功能。
价格与性价比考量
在价格方面,o1模型和o1 - Pro模型存在显著差异。o1模型作为基础版本,其使用成本相对较低,对普通用户而言更易接受。而o1 - Pro模型订阅费用高达200美元/月,是目前市场上较昂贵的个人用户订阅服务。
从性价比考量,对于普通用户日常需求,如简单的文本问答、一般性的信息获取等,o1模型已能满足,其性价比相对较高。然而,对于需要处理复杂专业问题的小型企业、科研人员或专业人士,如在博士级别科学问题解答、美国数学竞赛试题解答等方面有较高准确率需求的用户,o1 - Pro模型虽价格高昂,但因其性能提升能带来更高的工作效率和准确性,在特定场景下也具有一定的性价比。
智创聚合API已支持无限制使用
智创聚合API已宣布对OpenAI的o1和o1 - Pro模型提供支持,且已支持无限制使用。这对于开发者和企业用户来说是一个重要的消息,意味着他们可以更自由地利用这两个强大的AI模型进行各种应用的开发。智创聚合API通过先进的技术整合,确保了与o1和o1 - Pro模型的高效对接,为用户提供稳定、可靠的服务。在实际应用中,无论是利用o1模型的多模态能力进行创新应用开发,还是借助o1 - Pro模型的高性能处理复杂专业问题,智创聚合API都能提供有力的支持,进一步拓展了这两个模型的应用场景和价值。