OpenAI o1 简介

AGI舰长

已于 2024-09-27 09:07:16 修改

阅读量660

点赞数 5

分类专栏： AI大模型全栈通识课 AI全栈文章标签：人工智能

于 2024-09-27 09:04:53 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u012723183/article/details/142584444

版权

AI全栈同时被 2 个专栏收录

66 篇文章

订阅专栏

AI大模型全栈通识课

14 篇文章

订阅专栏

🎯 OpenAI o1 大模型默认自带 COT 过程

2024年 9 月 13 日，OpenAI 发布 o1-preview 和 o1-mini

- 文章1：OpenAI发布o1大模型，突破LLM推理极限，弥补了之前在数学、科学和代码方面的不足
- 文章2：预训练的 Scaling Law 正在走入死胡同，o1 让更多创业公司重新复活

o1 就像人类解决复杂问题，一般都是由“快思考”到“慢思考”的过程

- 之前其余大模型都是快思考的过程

OpenAI o1 是经过强化学习训练来执行复杂推理任务的新型语言模型。特点就是，o1 在回答之前会思考 —— 它可以在响应用户之前产生一个很长的内部思维链。也就是该模型在作出反应之前，需要像人类一样，花更多时间思考问题。通过训练，学会完善自己的思维过程，尝试不同策略，并认识到自己的错误。
传统大模型 COT 与o1 COT 原理对比

- 传统方案：prompt 复杂
- o1 模型： prompt 简单，但仍需要

o1 系列模型的主要特点

- 强大的推理能力，适用于复杂的问题
- 内部思考过程，产生“推理令牌”
- 128,000 token 的上下文窗口
- 适用于科学推理、编程和数学问题

bate 版本的限制

- 仅支持文本输入，不支持图像
- 公不支持系统消息
- 公不支持流式
- 不支持工具和函数调用
- 某些参数固定，如temperature和topp

基于 Python 通过 OpenAI API 实测 o1

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

AGI舰长 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。