逻辑推理能力堪比博士生,OpenAI发布全新AI模型系列: o1 - 大模型或许进入新阶段

个人是真的很兴奋,逻辑推理一直是大模型不擅长的部分,经常会出现自我矛盾和简单错误。一直在想着如何构建一个专注于逻辑推理的模型,然后外挂一个高效的知识库,肯定无敌。但没想到O1横空出世了

效果还有待实测,其实我个人是不建议花太多精力在安全性等方向的,AI或许没那么危险。

推荐下我的解密边读边解文: 解密OpenAI o1是如何让LLMs获得逻辑推理能力的 - CoT * RL-CSDN博客

OpenAI发布全新AI模型系列:o1

2024年9月12日,OpenAI宣布推出新一代AI模型系列o1,这是一种专注于复杂推理能力的全新模型。以下是o1的主要特点和信息:

核心特性

1. 增强推理能力: o1模型经过训练,能够在回答问题前进行更深入的思考,类似人类的思维过程。

2. 卓越的科学和数学能力: 在物理、化学、生物等领域的基准测试中,o1的表现堪比博士生水平。在国际数学奥林匹克竞赛(IMO)的资格考试中,o1正确解决了83%的问题,远超GPT-4o的13%。

3. 优秀的编程能力: 在Codeforces竞赛中,o1达到了89百分位的成绩。

4. 安全性提升: 通过新的安全训练方法,o1能更好地理解和应用安全规则。在一项严格的"越狱"测试中,o1-preview得分84分(满分100),远高于GPT-4o的22分。

产品线

1. o1-preview: 主力模型,具备强大的推理能力和广泛的知识储备。
2. o1-mini: 专为编程优化的小型模型,速度更快,成本更低(比o1-preview便宜80%)。

使用方式

- ChatGPT Plus和Team用户可立即在ChatGPT中使用o1模型。
- ChatGPT Enterprise和Edu用户将于下周获得访问权限。
- 符合条件的API开发者可以开始在API中使用这些模型进行原型开发。
- OpenAI计划未来向所有ChatGPT免费用户开放o1-mini的访问权限。

OpenAI表示,这只是o1系列的早期预览版本。他们计划继续改进模型,添加网页浏览、文件和图像上传等功能,以增强其实用性。同时,OpenAI也将继续开发和发布GPT系列模型。

这一发布标志着AI技术在复杂推理任务方面取得了重大突破,有望在科研、编程和数学等领域带来显著影响。

原文地址,如果需要翻译,可以留言,本文仅仅是简要的介绍和个人想法 //​https://openai.com/index/introducing-openai-o1-preview/​icon-default.png?t=O83Ahttp://xn--https-kt3b//openai.com/index/introducing-openai-o1-preview/%E2%80%8B

思考快与慢

不知道你发现过没有,反正我发现,有时候我说话的时候,比思考会快很多,很多话像不经过大脑就冒出来了,这时候虽然在侃侃而谈,但经常会忽略别人的感受。后面我也不怎么爱说话了,直到看了一些书,懂了些东西,其中就包括一本书《思考快与慢》

关于这本书

《思考,快与慢》是心理学家丹尼尔·卡尼曼(Daniel Kahneman)于2011年出版的一本书。书中探讨了人类思维的两种主要模式:系统1和系统2。

  • 系统1:快速、直觉、自动化的思维模式。这种思维方式快速而不费力,通常在面对简单问题或需要快速反应时运作,例如识别面孔或完成简单的数学运算。

  • 系统2:慢速、理性、需要努力的思维模式。这种思维方式用于解决复杂问题,需要深入分析和推理,例如制定计划或解决复杂的数学问题。

卡尼曼在书中探讨了这两种思维模式如何影响我们的决策和判断,以及它们可能带来的偏见和错误。通过一系列心理学实验和研究,作者揭示了人类思维中的各种认知偏差,并讨论了这些偏差如何影响个人和社会决策。

 我的尝试

最近我一直在用多个模型来模拟思考的过程,参考这本书的简单成功:直觉系统-理性系统,搭建一个能自我反思的系统:多个llm+内存记忆+裁决者+rag。但是没想到O1突然出现了,它能够自我反思,而且数据面的表现很惊人,具体效果待后续实测。真的很兴奋

智能究竟是什么

新模型的表现优异就在逻辑推理方面,我觉得这才是智能的真正体现。

今天上班的路上,我想了很多,就将一个简单的:

知识(有限的设定)

        1+1 = 2, 2+1 =3 .... 9+1 = 10 , 101 = 100 + 10 +1  ,11 * 3 = 11 + 11 + 11

智能(无限的推理)

     12313131321 + 12313131 = ?? 

真正的智能应该是有非常高的推理能力的,就像学了乘法表,就能计算所有的数学四则运算。学会了部分物理公式,就能推导出很多的定理,然后根据结果思考它的真实表现。这才是真的智能啊!!

冷静

不要恐惧

AI没有想象中那么糟糕,人总是会有危机感,因为我们无法知道别人的想法,总是觉得不踏实,不要恐惧,自在的踏入雨夜、进入未来:福兮祸之所倚,祸兮福之所寄。万事万物都有两面性,只是现在的你,或与没发现:所获之物都是有代价的,人生或许就是获取享受和失去

机遇

一个超强的逻辑模型如果出现,那必能创造一系列的新事物,尤其是给它与现实交互的能力之后,这相当于给死气沉沉的现在一针强心针,毕竟A股基金表现已经那么糟糕了。

思考

人类的角色在人类社会中是不可或缺的,要相信自己,努力尝试和学习新事物,它就能为你所用,不要迷信别人口中的“科技”,相信你掌握的科技!

最后,祝大家都能在新时代找到自己的节奏和大道,更好的了解自己、享受生活。

不要忘了休息哈~做个眼保健操吧,后续我体验后会出代码例子等,希望别让我失望!

2Cy

YU.H

午休前、摸鱼急书

  • 21
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

余生H

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值