如何搭建一个本地化知识库问答系统，支持 PDF、Word 等自由检索，并能够实现实时对话查询？

最新推荐文章于 2025-04-07 21:40:01 发布

大模型微调实战

最新推荐文章于 2025-04-07 21:40:01 发布

阅读量3.8k

点赞数 65

文章标签：人工智能 llama 学习产品经理 ui ai AI

本文链接：https://blog.csdn.net/2401_85373898/article/details/143876717

版权

背景

搭建一个本地知识库有许多好处。首先，它可以帮助我们集中存储和管理信息，使得查找和访问知识变得更加高效。其次，本地知识库可以提高工作效率，因为我们不必每次都依赖于互联网搜索。此外，它还有助于保护隐私，因为我们可以在本地存储敏感信息而不必上传到外部服务器。

‍

项目介绍

Ⅰ、项目地址：

https://github.com/chatchat-space/Langchain-Chatchat

Ⅱ、项目概述：

Langchain-Chatchat 是一个开源、可离线部署的检索增强生成（RAG）大模型知识库项目。
它结合了ChatGLM等大型语言模型和Langchain等应用框架，旨在构建一个对中文场景友好且支持开源模型的知识库问答解决方案。

Ⅲ、实现原理：

加载文件。
读取文本。
文本分割。
文本向量化。
问句向量化。
在文本向量中匹配与问句向量最相似的 top-k 个文本。
将匹配出的文本作为上下文和问题一起添加到 prompt 中。
提交给LLM（如ChatGLM）生成回答。

Ⅳ、支持模型：

LLM模型（本地）：

支持多个模型，例如Vicuna、Alpaca、LLaMA、Koala等。
Embedding模型（本地）：

支持多个HuggingFace中的模型，如m3e-small、m3e-base、m3e-large等。

Ⅴ、知识库初始化与迁移：

首次运行项目，需要初始化或重建知识库。

项目本地部署

准备：确保你的电脑拥有8GB以上的一张英伟达显卡，

Ⅰ、确保你的设备上安装了python，其版本应该控制在3.8～3.11之间，python下载地址：

https://www.python.org/downloads/

Ⅱ、确保你的设备安装了CUDA Toolkit，使用下面命令判断设备上是否安装了CUDA，

nvcc --version

如果没有类似以下内容的输出，

C:\Users\Administrator>nvcc --version``nvcc: NVIDIA (R) Cuda compiler driver``Copyright (c) 2005-2021 NVIDIA Corporation``Built on Mon_Sep_13_20:11:50_Pacific_Daylight_Time_2021``Cuda compilation tools, release 11.5, V11.5.50``Build cuda_11.5.r11.5/compiler.30411180_0

那么你需要到英伟达官网下载一个CUDA并完成安装，CUDA下载地址：

https://developer.nvidia.com/cuda-12-1-0-download-archive

打开这个网址后找到对应你操作系统版本的CUDA下载即可，

如果你因为网络原因，而无法下载这个CUDA Toolkit，那么这里我会为大家准备一个安装包，本文结尾有分享。

Ⅲ、将源代码下载到本地：

可以输入以下指令下载源代码：

git clone https://github.com/chatchat-space/Langchain-Chatchat

具体过程可以参考下图

如果还是因为网络原因而无法获取源代码去，那么同样在本文结尾也给大家准备好了相应的源代码。

Ⅳ、在Langchain-Chatchat项目内输入以下指令来创建一个虚拟环境：

Python -m venv venv

创建过程请参看下图所示

在刚打开的终端上输入以下指令来激活虚拟环境，这个终端请不要关闭！

.\venv\Scripts\activate

Ⅴ 、在上述终端继续输入以下命令来安装项目运行的全部依赖：

`pip install -r requirements.txt` `pip install -r requirements_api.txt``pip install -r requirements_webui.txt`

安装完毕后，输入指令”pip list “来查看应用torch 、torchvision、torchaudio是否为适用于GPU，如下所示：

如果你安装的”torch 、torchvision、torchaudio“为CPU版本，那么你需要输入以下命令来将其卸载：

pip uninstall torch torchvision torchaudio

随后输入以下命令来来安装GPU版本的torch、torchaudio、torchvison

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

Ⅵ、下载大模型

新建一个文件夹，在文件夹内打开终端，输入以下指令来下载对应的大模型。

git lfs install``git clone https://www.modelscope.cn/ZhipuAI/chatglm3-6b-32k.git``git clone https://www.modelscope.cn/AI-ModelScope/bge-large-zh-v1.5.git

这里将下载的模型chatglm3-6b-32k改为chatglm3-6b，如下图所示：

或者在huggingface上下载所需的模型：

git lfs install``git clone https://huggingface.co/THUDM/chatglm3-6b``git clone https://huggingface.co/BAAI/bge-large-zh

下载展示了一个下载过程：

Ⅶ、初始化项目配置

python copy_config_example.py``python init_database.py --recreate-vs

如果你是在windwos系统进行初始化操作，那么你必然会出现下图所示的错误：

为此你需要输入以下命令刚安装的依赖包进行降级！

pip install langchain-community == 0.0.19

在降级后，你就可以继续初始化操作了，

整个初始化过程大概需要十分钟左

Ⅷ、运行项目

在终端输入以下命令来运行项目：

python startup.py -a

如果是第一次运行的话，系统会提示你输入一个邮箱账号，

最后你会得到如下画面，将下图所示的url链接复制下来，然后在浏览器内打开，这样你就可以使用基于Langchain-Chatchat构建的本地知识库了！

随后你就可以上传你的本地文件，然后来构建你的知识库了，

如果你愿意，你也可以使用Langchain-Chatchat进行本地AI机器人聊天。

当然，为了下次更快地启动这个项目，下次你在项目Langchain-Chatchat文件夹内输入以下指令即可快速启动整个项目：

.\venv\Scripts\activate``python startup.py -a

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述