Research Agent：具有解决基于大型文本语料库的复杂问题，具备深度多跳推理的能力

lichunericli

已于 2024-03-08 19:13:52 修改

阅读量1.2k

点赞数 23

文章标签：人工智能自然语言处理

于 2024-03-08 18:48:22 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lichunericli/article/details/136569158

版权

本文介绍了一种自主人工智能研究代理，旨在解决基于大型文本语料库的复杂问题，特别是涉及深度多跳推理的KBQA。通过对比不同的代理方法，如ReAct和Self-Ask，作者探讨了如何实现更准确的推理和答案生成。研究代理模仿人类研究过程，通过迭代提问和答案验证来逐步接近最终答案，减少了幻觉和错误的发生。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

原文地址：https://towardsdatascience.com/the-research-agent-4ef8e6f1b741

2023 年 8 月 29 日

问题简介

在2021年，开始应对基于大量文本回答问题的挑战。在预训练transformers之前的时代，这个问题很难破解。

人工智能和大型预训练transformers的快速进步正在从根本上深刻地改变技术世界。

应对基于大量文本回答问题的总体思路是制作个可以处理任何复杂知识库的自主研究代理。

研究代理

在这里，我将讨论一个自主人工智能研究代理的设计和实现，它可以解决具有深度推理能力的多跳KBQA问题。

需要研究代理的原因

向 ChatGPT 询问了几个有关《摩诃婆罗多》的问题。我对一些问题得到了很好的答案。然而，他们大多数人缺乏严谨性。这是预期的。GPT 在通用数据集上进行训练。它可以很好地理解和解释自然语言。它也可以很好地推理。然而，它并不是任何特定领域的专家。因此，虽然它可能对《摩诃婆罗多》有一些了解，但它可能不会给出经过深入研究的答案。有时 GPT 可能根本没有任何答案。在这些情况下，它要么谦虚地拒绝回答问题，要么自信地编造问题（幻觉）。

实现 KBQA 的第二个最明显的方法是使用检索 QA 提示。这就是 LangChain 开始变得非常有用的地方。

检索质量保证

对于那些不熟悉 LangChain 库的人来说，这是在代码中使用 GPT 等 LLM 的最佳方法之一。这是使用 LangChain 的 KBQA 实现。

使用检索器进行QA检查

总而言之，以下是在任何文档主体上实现 KBQA 的步骤：

将知识库拆分为文本块。
为每个块创建数字表示（嵌入）并将其保存到矢量数据库中。
如果您的数据是静态的，则步骤 1 和 2 是一次性的工作。
使用用户对此数据库的查询运行语义搜索并获取相关文本块。
将这些文本块与用户的问题一起发送给法学硕士，并要求他们回答。

这是此过程的图形表示。

这种方法非常适合解决简单且是事实的知识库上的简单问题。然而，它不适用于更复杂的知识库和需要更深入、多跳推理的更复杂的问题。多跳推理是指采取多个步骤的逻辑或上下文推理来得出问题的结论或答案的过程。

此外，LLMs可以在一篇提示中咀嚼的文本长度受到限制。当然，您可以一次发送一份文件，然后在每次通话时“完善”或“减少”答案。然而，这种方法不允许复杂的“多跳”推理。在某些情况下，使用“优化”或“减少”方法的结果比简单地将所有文档填充到单个提示中要好，但差距并不大。

对于复杂的知识库，用户的问题本身可能不足以找到所有可以帮助LLM得出准确答案的相关文档。例如：

阿朱那是谁？

这是一个简单的问题，可以在有限的上下文中回答。然而，有以下问题：

最低0.47元/天解锁文章

博客等级

码龄9年

406
原创

1万+
点赞

9803
收藏

6903
粉丝

关注

私信

热门文章

分类专栏

传统文化-易经 11篇
数据库 10篇
经济学 2篇
沟通 1篇
人工智能 8篇
Java 2篇
缓存 4篇
架构 1篇
搜索引擎 4篇
消息队列 2篇
微服务 1篇
注意事项 1篇
LLM 应用实现总结 8篇
GIT 1篇
IM即时通讯 1篇

最新评论

记一次港交所面试
liulicsu: 是纯英文面试吗
拆解 Transformer 的训练过程
tjuwzan: 最近在看Transformer的知识，的确有些地方有点没搞明白，想先请教几个问题： 1. 本篇主要讲Transformer的训练环境，图上模型最右侧，也就是Decoder的下面，是Output Embedding, 最上面是Output，他们之间有关系吗？ 2. 训练，如果是传统的机器学习或者深度学习，如果是Supervised Learning的话，应该有输入，ground truth，以及loss function，但Transformer很少有人提这个，那么Transformer的学习过程是什么？Loss Function是什么？ 3. 还是训练问题，普通深度学习模型学习的大概是W and B，Transformer的学习是Wq, Wk, Wv吗？是如何学习的呢？尤其在第7节里描述：例如，对于计算 Query 矩阵，权重矩阵的行数必须与转置矩阵的列数相同，而权重矩阵的列数可以任意；例如，我们假设权重矩阵有 4 列。权重矩阵中的值介于 0 和 1 之间，随机初始化，当 Transformer 开始学习语料的含义时，这些值会更新。文中提到的三句话，是不是语料？咱们的例子中是不是就是用这三句话作为训练例子呢？ 4. 依然是文章中描述的，把when you play the game of thrones, you win or you die. 这句话有两个部分，前面部分作为输入，后面部分作为输出，那么第一句，I drink and I know things，这里面只有一句，怎么分输入和输出呢？ 5. 掩码的作用没太理解，可否解释一下呢？很多都说是为了让模型只参考前面，而不看后面，这句话还是没有真正理解。程序员出身，一直是按照程序员思维想弄清楚每个细节，但是NLP基础有点薄弱，理解一些思想有点难度。多谢解答
Java内存模型（JMM）与Volatile关键字底层原理
Yunwushenyanying: 讲的太全面了！非常有帮助
记录些MySQL题集（4）
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/619168846。
DSPy入门：告别指令提示，拥抱编程之旅！
LK12mufc: 可以理解成，langchain和llamaindex需要自己写prompt。DSPY自动写prompt？？如果是这样，最终到LLM那里还是一样的呀

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。