1K star!开源版 GPT-o1 就来啦?!

最近OpenAI新推出了史上最强的GPT-o1模型,它在处理复杂推理任务时展现出了强大的能力,尤其在数学、物理、化学和生物学等领域的表现达到了非常高的水准,可以说把大语言AI模型又推向了一个新高度。

也就在差不多的时间,Github上面也出现了一个非常酷的开源项目——g1,在AI圈里引起了不小的轰动,甚至被认为是o1的首个开源版。

今天开源君就和大家来聊聊这个项目。

项目简介

g1(全称是不是可能叫“Genius 1”,哈哈,我猜的)使用了一个叫做Llama-3.1 70b的模型,运行在Groq硬件上。这个项目尝试用一种新的方法来提升大型语言模型(LLM)的推理能力,目标是通过一种特殊的提示策略,让AI能够像人类一样进行逻辑推理,解决一些复杂的逻辑问题。

想象一下,如果你的AI助手不仅能回答问题,还能像侦探一样一步步展示它的思考过程,如同o1一样,那岂不是很酷?

开源仅仅几天时间就收获了近 1K star!

工作原理

这个项目用到了一些非常酷的技术,让AI能够像人类一样进行逻辑推理。

1、使用Llama-3.1 70b模型

g1项目的核心是一个叫做Llama-3.1 70b的模型。这个模型在Groq硬件上运行,它能够创建动态的推理链,让AI能够“思考”并解决一些复杂的逻辑问题。

2、推理链

在g1中,每次推理都是一个步骤,AI可以选择继续进行下一个推理步骤,或者给出最终答案。每一步都有一个标题,描述这一步在做什么,并且对用户是可见的。

3、提示策略

g1使用了一系列特殊的提示来引导AI进行推理。这些提示可能包括:

  • 使用多个推理步骤:至少3个,确保AI有足够的时间进行思考。

  • 意识到自己的局限性:AI需要知道自己能做什么,不能做什么。

  • 探索替代答案:AI需要考虑自己可能是错误的,并尝试其他可能的解决方案。

  • 重新检查:如果AI认为自己可能错了,它需要真正地重新检查,并尝试不同的方法。

  • 使用至少3种方法得出答案:这有助于AI通过不同的方法来找到正确的答案。

4、JSON格式的响应

g1要求AI以JSON格式进行响应,包括“标题”、“内容”和“下一步行动”(继续或最终答案)。

5、可视化推理

g1的一个特点是它能够将AI的推理过程可视化。用户可以看到AI是如何一步步解决问题的,这不仅增加了透明度,也提高了用户对AI的信任。

快速使用

如果你想自己试试g1,可以按照下面的方法:

克隆项目后,使用Streamlit UI,按下面操作:

python3 -m venv venv   source venv/bin/activate   pip3 install -r requirements.txt   export GROQ_API_KEY=gsk...   streamlit run app.py      

使用Gradio UI

cd gradio   pip3 install -r requirements.txt   python3 app.py      

项目展示

g1的体验可以说是非常直观的,和o1看起来有点类似,每一步都会有一个标题,描述这一步在做什么,以及内容。最后,它会告诉你它是要继续推理,还是要给出最终答案。

下面是之前测试模型大家都最喜欢问的2个问题,

1、strawberry中有多少个r   2、x.9和x.11哪个大   

结合完整的思考之后,g1都能回答正确!

据说在没有提示的情况下,Llama-3.1-70b 的准确率为 0%,ChatGPT-4o 的准确率为 30%。而g1在无需任何训练,就足以在strawberry问题上达到 ~70% 的准确率。

官方给出的提示词如下:

You are an expert AI assistant that explains your reasoning step by step. For each step, provide a title that describes what you're doing in that step, along with the content. Decide if you need another step or if you're ready to give the final answer. Respond in JSON format with 'title', 'content', and 'next_action' (either 'continue' or 'final_answer') keys. USE AS MANY REASONING STEPS AS POSSIBLE. AT LEAST 3. BE AWARE OF YOUR LIMITATIONS AS AN LLM AND WHAT YOU CAN AND CANNOT DO. IN YOUR REASONING, INCLUDE EXPLORATION OF ALTERNATIVE ANSWERS. CONSIDER YOU MAY BE WRONG, AND IF YOU ARE WRONG IN YOUR REASONING, WHERE IT WOULD BE. FULLY TEST ALL OTHER POSSIBILITIES. YOU CAN BE WRONG. WHEN YOU SAY YOU ARE RE-EXAMINING, ACTUALLY RE-EXAMINE, AND USE ANOTHER APPROACH TO DO SO. DO NOT JUST SAY YOU ARE RE-EXAMINING. USE AT LEAST 3 METHODS TO DERIVE THE ANSWER. USE BEST PRACTICES.      Example of a valid JSON response:   json   {       "title": "Identifying Key Information",       "content": "To begin solving this problem, we need to carefully examine the given information and identify the crucial elements that will guide our solution process. This involves...",       "next_action": "continue"   }   

当然,g1项目虽然很酷,但它还在实验阶段,所以并不完美。它的推理准确性还没有经过大规模的正式评估,尽管在一些测试中表现不错,但可能在更复杂或不同类型的问题上还有待提高。

另外,g1目前主要依赖于特定的提示策略来引导AI进行推理,这意味着如果问题没有被很好地格式化或者提示不够明确,AI可能就无法正确理解问题或给出准确的答案。

还有,g1的性能也受限于它所使用的模型Llama-3.1 70b的能力,以及Groq硬件的性能。随着AI技术的发展,未来可能需要进一步优化和升级这些组件来满足更高的性能要求。

不管怎样,g1依然是一个非常有趣的项目,它展示了通过提示策略提升AI推理能力的潜力。虽然它现在还不完美,但已经能够解决60%到80%的常见逻辑问题,这已经是一个很大的进步了。

更多细节功能,感兴趣的可以到项目地址查看:

项目地址:
https://github.com/bklieger-groq/g1

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述

第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范

第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署

第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建

第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型
  • 带你了解全球大模型
  • 使用国产大模型服务
  • 搭建 OpenAI 代理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何优雅地在阿里云私有部署开源大模型
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法备案

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值