【拥抱AI】浅谈CoT(Chain of Thought)主流框架

什么是CoT?

  • CoT是思维链(Chain of Thought)的缩写, 这是一种用于促进大型语言模型进行推理的提示方法。通过向模型展示一些示例,并在这些示例中解释推理过程,模型在回答问题时也会展示其推理步骤。这种方法可以显著提高模型在需要多步推理的任务上的表现,尤其是在标准提示效果不佳的情况下。

CoT如何帮助提高模型的推理能力?

  • CoT通过模拟人类的逐步思考过程,帮助大型语言模型(LLMs)在处理复杂任务时提高推理能力。CoT提示策略要求模型不仅输出最终答案,还要展示中间推理步骤,这有助于模型更好地理解问题的上下文和复杂性,避免跳跃性错误,并提高答案的准确性和模型输出的解释性。

  • 最新的研究表明,CoT可以通过不同的方法和技术来实现和优化。例如,Google提出的CoT-decoding方法是一种解码技术,它能够在没有外部提示的情况下自发地揭示CoT推理路径,从而改善模型的推理能力和准确性。此外,上海交大提出的Meta-CoT是一种在输入问题类型未知的混合任务场景中通用的CoT提示方法,它通过场景识别、Demo选择和答案推理三个阶段来提高推理的准确性和效率。

  • CoT的应用不仅限于解决数学问题,还包括逻辑推理、编程问题等需要复杂推理的任务。通过这些技术,大型语言模型能够更好地模拟人类的思考过程,从而在各种应用场景中提供更加可靠和透明的推理结果。

CoT的主流框架有哪些?都有什么特点?

  1. AutoGPT:这个大家应该比较熟悉,开源免费,在github上有166K的Star,是由Significant Gravitas Ltd.开发,源码地址:https://github.com/Significant-Gravitas/AutoGPT 。
    他的设计理念是基于大型语言模型,通过自主迭代和使用互联网及其他工具来实现用户设定的目标。它旨在减少用户与AI交互时的人工干预,使AI能够更自主地完成任务。AutoGPT更适合于内容创作、智能客服、数据分析、搜索引擎优化、机器翻译和语音识别等。

  2. MetaGPT: 由DeepWisdom团队开发,以面向编程的多智能体框架,嵌入SOPs增强协作能为设计理念,支持复杂智能体互动,带有丰富的预定义智能体库,是一个比较适合复杂任务的多智能体框架,适用于网络密集的异步操作,只要一句话就可以生成一款软件或者游戏。还蛮好玩的,大家可以自己试试,安装也挺方便的,可以自定义切换LLM。
    源码地址:https://github.com/geekan/MetaGPT

  3. XAgent:这是由面壁智能(ModelBest)联合清华大学NLP实验室共同开发的一款超强智能体应用框架,主要是为了让智能体自主解决各种任务,终极目标是创建一个可以解决任何任务的超级智能体(这个目标有点凶残*_*)。它比较适用于需要高度自主性和通用解决方案的任务,可以考虑自动化办公、数据分析方向。
    源码地址:https://github.com/OpenBMB/XAgent

  4. ChatDev:这也是由面壁智能(ModelBest)联合清华大学NLP实验室共同开发,和XAgent在方向上刚好相反。它更倾向于使用多智能体协作的方式来完成任务。它是一款多智能体协作开发框架,旨在通过多智能体协作运营的虚拟软件公司,自动化全流程软件开发。由于它面向软件开发的自动化,强调多智能体之间的交互式协同,所以更适用于快速软件开发,特别是制作小游戏、网站开发、线上活动创意设计等多种软件开发任务。
    源码地址:https://github.com/OpenBMB/ChatDev

  5. AutoGen:由微软开发并发布在github社区上的一款支持自主运行和人工监督相结合的框架,它简化了Multi-Agent系统的开发,支持不同任务创建专门的Agent,以促进AI对话的稳健性。比较适合用于一些高级的AI对话、客服、知识问答等等。
    另外,微软最近又出了一个AutoGen Studio,还没有去细看,据说是无code,完全用UI进行编程,进而完成各种复杂推理任务的,有兴趣的小伙伴可以自行查找。
    源码地址:https://github.com/microsoft/autogen

  6. CrewAI:由CrewAI Inc.推出的一款通过角色专业化来促进复杂任务的完成,用协调角色扮演型智能体,促进模块化和可重复使用的智能体设计,并支持任务委派和集体智慧的一套框架。可以灵活自定义Agent以及各Agent的任务,可以进行有序的推理活动,从而一步步完成复杂的任务。适用于高级项目管理模拟、协作式创意写作系统、事件规划、财务分析等。比如让它帮忙输出一份“俄罗斯方块的开发计划”,当然,Agent和Task要自己设定好,Agent可以设定4个,分别项目经理、产品经理、开发人员和测试人员,再创建各角色对应的任务,再去执行就好了,更多细节请参考源码。
    源码地址:https://github.com/crewAIInc/crewAI

总结:CoT思维链更多的是做一些比较复杂的、系统性的任务,比如可以让LLM读一本书,再让它自己思考,总结一下书本某个人物的性格,再预测一下这个人物的结局。相对简单的任务就没必要让它出马了,当然它还有很多应用场景,这里不一一列举。

以上就是当前了解的一些内容,如有认知错误的地方,还请批评指正,谢谢。

  • 22
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值