今天在群里看见 LLM 给 Agent 提供了基础推理能力
引言
现在几乎将自己所有的业余时间都投入到 Agent 框架上,有时候也知道自己在做一件看不清 future 的事,当然因此也会迷茫、失落甚至怀疑。这些都是源于我们对这件事的期望。有些时候做事不能想太多,想得多也就做不成事,毕竟我自己认知很浅薄。
我觉做事首先,也是最重要的就是你喜欢做,这是前提,是拿到结果必要前提,其他都是次要的。至少这是我的观点,你做事的动力又是什么呢?
为了能够自己写出一个像模像样的 Agent 框架,的确下了不少功夫,翻译论文,看其他框架的源码,不断研究和总结,大概半年的时间过去了,终于对 Agent 框架有了一个大概的构思。今天拿出来跟大家分享。
希望我的分享对于想要了解 agent 或者正在寻找 LLM 落地正确方式的人给予帮助。由于是科技文章,难免枯燥乏味,这里虽然自己也在努力提升自己的表达,但是由于自己的能力有限,还有就是个人认为对于科学和科技还是要一丝不苟,严肃认真。
目标
LLM 局限性
- 实时性
- 真实性(幻觉)
- 工具使用: 融合外界环境信息,提升可靠信号反馈
- 反问机制: 主动询问以,通过自我反省来修复问题
- 扩展性(自主性)
- 缺乏逻辑性
今天推出 tinyChain,logo 可能是下面一个可爱的小章鱼,为什么用小章鱼做 logo 呢,首先章鱼是足够聪明的动物,而且可以做一些多线程的事,还有就是… 这个认识我的人很容易猜到。
今天不会谈过多 Agent 框架设计的细节,会在随后分享内容逐渐细化。自己知识也是不断迭代,更新,所以今天内容可能在明天就 out of date,请大家关注我,实时获取最新的关于 Agent 的内容
langChain 的问题
- 虽然 langChain 带来许多新的概念,这些概念都是围绕如何快速地开发一个基于 LLM 的应用,但是想要消化这些概念也是带来一些学习成本
- 条条框框让简单变得反而复杂,繁琐,感觉是什么都想要
当然 langChain 作为 Agent 框架的先行者,已经做的很好,因为很多方面还是探索,并且大模型也在不断迭代,一遍探索一遍还要跟上大模型的发展的脚步。
tinyChain
tinyChain 的特点
- langChain 存在一些问题,这样便有了我的 tinyChain 空间,关于 langChain 问题下面
- tinyChain 更了解国内应用的场景
- tinyChain 是顺势而行,不带来额外的学习成本,不会引入新的概念
- tinyChain 是一个由实践来驱动开发框架
之前提及到 aZent,tinyChain、promptChain 都是为了他进行铺垫
Agent 开发流程
- 将需求进行划分若干个任务,调整这些任务,初步判断任务的合理性
- 将分解好任务用 LLM 去尝试完成一个一个任务,在看是否可以通过 LLM 实现任务同时调整出一个合适的 prompt
- 基于 langChain 和 langGraph 来实现一个 Agent 来将整个流程串起来,实现自动化
- 对于个人开发者、小企业存在生存的空间,也为 Agent 设计针对特定框架
- 解决方案已经初步浮出水面,并且逐步完善,还是有待实践去检验
那些事是 Agent 擅长做的
- 探索性
- 繁琐的、可程序化,流程化的
- 模拟场景
- 分析
tinyChain 最佳的实践
- 编程辅助,因为大语言模型训练数据不小一部分来自于 github 所以 Agent 具有一定编程能力,或看似的逻辑能力
- 数据分析类,市场分析,商业分析和学术研究
- 生成类,生成数据集,写博客
- 多轮对话机器人,是长短期记忆的实现
- 问答类,教育等咨询、智能客服
- 翻译类
- 推荐类: 这里把推荐
- 社交聊天
不过还是要看到在很多需要可解释性,准确性的领域,由于大语言模型本身的问题还是无法涉足的。
Agent 框架的现况
- Agent 百花齐放, AutoGen、metaGPT、crewAi、
- 主流的基于 LLM 的 Agent 框架: langchain、llamaindex, Haystack
框架的选择
Agent 面临挑战
- 稳定性和可靠性问题,这个多半是源于大语言模型结构,暂时来看很难有效根治这个问题
- 如何节省成本、token 成本和时间的成本
- 如何更有效扩展 context 的容量,突破因 context 带来限制
- 也就是群体智能,记忆管理、实现高效和可扩展的群体协同(A(gent)Net)
- 应该如何低成本有效地进行迭代和进化也是值得思考的问题
- Agent 如何培养空间感,从语言理解层面脱离,可以感知空间从而成为具身智能的底座
- Agent 在解决多步问题复杂任务应该
- Agent 的能力,语言理解的能力(LLM)、如何有效使用工具的能力(Tool Usage)
- Multi Agent 协同,在 Agent 之间交互形式,如何有效地传递信息
解决方案
- Agent 应该有回溯能力
- Agent 结构化,如何通过横向和纵向的切分来划分 Agent,这里引入 layer 概念,layer 是从横向角度来切分 Agent,好那么 layer 之间划分的依据是什么,
- 希望将图这样数据结构引入到 Agent 框架,来描述 Agent 的组织形式。
- 拓扑结构: 拓扑结构,有向图
- 路径搜索能力
- 行为路由
Agent 类型
- 任务完成型
- 社会模拟型
主要模块
- 规划模块(planning)
- 路由模块(route)
- 指令模块(prompt)
- 工具模块(tool)
- 记忆模块(memory)
- 知识模块(knowledge)
随后分享我们会围绕 Agent 组成主要模块的定义、用途以及如何实现来展开,请大家关注、点赞。
如何学习AI大模型?
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;
第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;
第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;
第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;
第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;
第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;
第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。
👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;
• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;
• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;
• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。
1.AI大模型学习路线图
2.100套AI大模型商业化落地方案
3.100集大模型视频教程
4.200本大模型PDF书籍
5.LLM面试题合集
6.AI产品经理资源合集
👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓