Linux下搭建基于本地知识库大模型
基于本地知识库大模型搭建教程
1.安装postgresql
1.1 参考此文章安装
https://blog.csdn.net/qq_38973841/article/details/118081479?spm=1001.2014.3001.5506
1.2 创建数据库
1)执行 ./psql -U postgres 进入数据库后,会变成如下图片
2)在postgres下执行如下语句,第一句创建test数据库,第二句安装扩展
CREATE DATABASE TEST;
CREATE EXTENSION IF NOT EXISTS vector;
1.3 全局环境配置
1)输入vim ~/.bashrc(在哪输入都行,也可以直接可视化打开)
在 ~/.bashrc 文件中最后一行中添加如下语句(根据1.1步骤安装的路径/home/postgresql/install/bin ) :
export PATH=$PATH:/home/postgresql/install/bin
(PS:上面的路径一定要改为自己postgresql的安装路径)
2)输入source ~/.bashrc (激活变量配置)
2.项目编译
2.1 设置RGROOT路径
1)执行 conda activate LLM 激活虚拟环境(LLM是虚拟环境名称)
2)在源码路径下(root身份,Langchain-Chatchat目录下),执行如下语句:
set “PGROOT=/home/postgresql/install/bin”
(PS:路径是postgresql的安装路径)
2.2 下载pgvector文件
1)在Langchain-Chatchat目录下执行如下语句下载pgvector文件:
git clone --branch v0.4.4 https://github.com/pgvector/pgvector.git
2)也可以直接文件下载,复制粘贴到Langchain-Chatchat目录下(以window目录为例,linux相同,1)和2)二选一即可)
2.3 执行编译
1)进入刚下载好的pgvector目录,执行make -f Makefile语句
2)在pgvector目录执行make -f Makefile install语句
3.数据库准备
3.1 初始化
1)在configs目录下执行python -m spacy download en_core_web_sm语句。
2)在configs目录下执行python -m spacy download zh_core_web_sm语句
3)在configs目录下执行pip install psycopg2语句
4)在configs目录下执行pip install pgvector语句
4.初始化向量库
4.1 初始化
1)在Langchain-Chatchat目录下,执行python init_database.py --recreate-vs语句,进行数据初始化