吃鱼不养鱼:大语言模型(LLM)应用方法探讨

文章提出了一种无需额外训练大语言模型的方法,通过Langchain作为顾问团提供业务数据,而ToolLearning作为小助手执行特定任务,弥补大模型在实时信息和特定业务功能上的不足。这种架构利用LLM的推理能力,结合开源工具如ChatGPT-Plugins,实现更高效的应用程序构建。
摘要由CSDN通过智能技术生成

大语言模型需要65B或更多参数量才能涌现足够的推理能力,这对于训练或微调是极大的资源与人力挑战,那有没有办法不训练模型来充分利用大语言模型的能力?这还真有,办法是顾问团与小助手。

核心架构是 以LLM为中心,作为中枢调度,Langchain方式作为顾问团(提供业务相关资料),Tools作为小助手,被LLM调用来获得具体的能力。 这种方式可以补充大模型对于实时知识的不足以及具体业务能力(如复杂 数据计算)的不足,利用大模型的推理与归纳能力。

lanchain:  LangChain 完整指南:使用大语言模型构建强大的应用程序 - 知乎 (zhihu.com)

tool learning:   OpenBMB/BMTools: Tool Learning for Big Models, Open-Source Solutions of ChatGPT-Plugins (github.com)

系统架构图:

 

本质上,langchain工具包也有部分类似tool learning的功能:

Tool Learning 架构图:

 

 

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值