如何使用 Qwen3 实现 Agentic RAG？

最新推荐文章于 2025-05-14 14:43:48 发布

大模型面试宝典

最新推荐文章于 2025-05-14 14:43:48 发布

阅读量853

点赞数 18

分类专栏：自然语言处理大模型LLMs 检索增强生成文章标签：人工智能深度学习 AIGC 自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43520816/article/details/147934321

版权

大模型LLMs 同时被 3 个专栏收录

47 篇文章

订阅专栏

自然语言处理

44 篇文章

订阅专栏

检索增强生成

6 篇文章

订阅专栏

今天，我们将学习如何部署由阿里巴巴最新Qwen 3驱动的Agentic RAG。

这里是我们的工具栈：

CrewAI用于代理编排。
Firecrawl用于网络搜索。
LightningAI的LitServe用于部署。

顶部的视频展示了这一过程。

图表显示了我们的Agentic RAG流程：

检索代理接受用户查询。
它调用相关工具（Firecrawl网络搜索或向量DB工具）以获取上下文并生成见解。
写作代理生成响应。

接下来，让我们实现并部署它！

代码稍后在问题中链接。

这里是为我们的Agentic RAG服务的完整代码。

setup方法编排代理。
decode_request方法准备输入。
predict方法调用Crew。
encode_response方法发送响应回来。

让我们下面一步一步理解它

Set up LLM

CrewAI与所有流行的LLMs和提供商无缝集成。

这里是通过Ollama设置本地Qwen 3的方式。

Define Research Agent and Task

这个代理接受用户查询，并使用向量DB工具和由Firecrawl驱动的网络搜索工具检索相关上下文。

再次，在LitServe的setup()方法中放入这个：

Define Writer Agent and Task

接下来，写作代理接受研究者代理的见解以生成响应。

我们再次在LitServe的setup方法中添加这个：

Set up the Crew

一旦我们定义了代理及其任务，我们使用CrewAI将它们编排成一个团队，并将其放入一个设置方法中。

Decode request

我们已经编排了Agentic RAG工作流程，该工作流程将在收到请求时执行。

接下来，从收到的请求体中提取用户查询。

检查下面突出显示的代码：

Predict

我们使用解码的用户查询，并将其传递给之前定义的Crew，以从模型生成响应。

检查下面突出显示的代码：

Encode response

这里，我们可以对响应进行后处理并将其发送回客户端。

注意：LitServe内部按顺序调用这些方法：decode_request → predict → encode_request。

检查下面突出显示的代码：

我们完成了服务器代码。

接下来，我们有基本的客户端代码来调用我们使用requests Python库创建的API：

完成！

我们已经使用LitServe部署了完全私有的Qwen 3 Agentic RAG。这里是部署的Qwen3 Agentic RAG的回顾。

原文地址：https://blog.dailydoseofds.com/p/deploy-a-qwen-3-agentic-rag

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。