开源大语言模型作为 LangChain 智能体

Every DAV inci

已于 2024-08-20 21:44:22 修改

阅读量625

点赞数 12

分类专栏： HuggingFace 文章标签：开源语言模型 langchain

于 2024-08-20 21:43:43 首次发布

本文链接：https://blog.csdn.net/ahahayaa/article/details/141369200

版权

开源大语言模型作为 LangChain 智能体

概要

开源大型语言模型 (LLMs) 现已达到一种性能水平，使它们适合作为推动智能体工作流的推理引擎: Mixtral 甚至在我们的基准测试中超过了 GPT-3.5，并且通过微调，其性能可以轻易的得到进一步增强。

引言

针对因果语言建模训练的大型语言模型 (LLMs) 可以处理广泛的任务，但它们经常在逻辑、计算和搜索等基本任务上遇到困难。最糟糕的情况是，它们在某个领域，比如数学，表现不佳，却仍然试图自己处理所有计算。

为了克服这一弱点，除其他方法外，可以将 LLM 整合到一个系统中，在该系统中，它可以调用工具: 这样的系统称为 LLM 智能体。

在这篇文章中，我们将解释 ReAct 智能体的内部工作原理，然后展示如何使用最近在 LangChain 中集成的 ChatHuggingFace 类来构建它们。最后，我们将几个开源 LLM 与 GPT-3.5 和 GPT-4 进行基准测试。

什么是智能体？

LLM 智能体的定义非常宽泛: 它们指的是所有将 LLMs 作为核心引擎，并能够根据观察对其环境施加影响的系统。这些系统能够通过多次迭代“感知 ⇒ 思考 ⇒ 行动”的循环来实现既定任务，并常常融入规划或知识管理系统以提升其表现效能。你可以在 Xi et al., 2023 的研究中找到对智能体领域综述的精彩评述。

今天，我们将重点放在 ReAct 智能体 上。ReAct 采用一种基于“推理 (Reasoning)”与“行动 (Acting)”结合的方式来构建智能体。在提示词中，我们阐述了模型能够利用哪些工具，并引导它“逐步”思考 (亦称为思维链行为)，以规划并实施其后续动作，达成最终的目标。

drawing

ReAct 智能体内部工作原理示例

上述图解虽显得有些抽象，但其核心原理其实相当直接。

参见此笔记本: 我们借助 Transformers 库展示了一个最基础的工具调用实例。

本质上，LLM 通过一个循环被调用，循环中的提示包含如下内容:

这里是一个问题: “{question}”
你可以使用这些工具: {tools_descriptions}。
首先，你需要进行‘思考: {your_thoughts}’，接下来你可以:
- 以正确的 JSON 格式发起工具调用，
- 或者，以‘最终答案:’为前缀来输出你的答案。

接下来，你需要解析 LLM 的输出:

如果输出中包含‘最终答案:’ 字符串，循环便结束，并输出该答案;
若不包含，则表示 LLM 进行了工具调用: 你需解析此输出以获得工具的名称及其参数，随后根据这些参数执行相应工具的调用。此工具调用的结果将被追加至提示信息中，然后你将带有这些新增信息的提示再次传递给 LLM，直至它获得足够的信息来给出问题的最终答案。

例如，LLM 的输出在回答问题:

最低0.47元/天解锁文章

Every DAV inci

关注

12
点赞
踩
29

收藏

觉得还不错? 一键收藏
打赏
0
评论
开源大语言模型作为 LangChain 智能体

LLM 智能体的定义非常宽泛: 它们指的是所有将 LLMs 作为核心引擎，并能够根据观察对其环境施加影响的系统。这些系统能够通过多次迭代“感知 ⇒ 思考 ⇒ 行动”的循环来实现既定任务，并常常融入规划或知识管理系统以提升其表现效能。你可以在的研究中找到对智能体领域综述的精彩评述。今天，我们将重点放在ReAct 智能体上。ReAct采用一种基于“推理(Reasoning)”与“行动(Acting)”结合的方式来构建智能体。在提示词中，我们阐述了模型能够利用哪些工具，并引导它“逐步”思考 (亦称为思维链。
复制链接

扫一扫