Langchain+Milvus+Chatglm2实现基于大模型的知识问答

swimhigh

已于 2023-11-03 14:16:32 修改

阅读量837

点赞数 1

文章标签： langchain milvus 人工智能

于 2023-11-03 11:17:16 首次发布

本文链接：https://blog.csdn.net/swimhigh/article/details/134198984

版权

本文介绍了如何下载和配置ChatGLM2大模型，包括安装依赖、调整代码以支持多GPU，以及使用Langchain和Milvus进行向量搜索和大模型问答。步骤包括下载模型、修改API、集成Langchain和导入向量数据到Milvus。

摘要由CSDN通过智能技术生成

一、准备工作

     git clone https://github.com/THUDM/ChatGLM2-6B

cd ChatGLM2-6B

# 其中 transformers 库版本推荐为 4.30.2，torch 推荐使用 2.0 及以上的版本，以获得最佳的推理性能

pip install -r requirements.txt

# 这里我将下载的模型文件放到了本地的 chatglm-6b 目录下

git clone https://huggingface.co/THUDM/chatglm2-6b

# 因为前面改了模型默认下载地址，所以这里需要改下路径参数

# 修改 open_api.py 文件

if __name__ == "__main__":

tokenizer = AutoTokenizer.from_pretrained("/home/XXX/glm_model/chatglm2-6b", trust_remote_code=True,device='cuda:2')

model = AutoModel.from_pretrained("/home/XXX/glm_model/chatglm2-6b", trust_remote_code=True,device='cuda:5')

# 多显卡支持，使用下面两行代替上面一行，将num_gpus改为你实际的显卡数量

# from utils import load_model_on_gpus

# model = load_model_on_gpus("THUDM/chatglm2-6b", num_gpus=2)

uvicorn.run(app, host='0.0.0.0', port=8008, workers=8)

python open_api.py

#pytorch等基础环境的安装这里不作过多说明

Pip install langchain

Pip install milvus

#这里使用text2vec-base-chines HuggingFace 魔搭社区等都能下载 https://modelscope.cn/models/thomas/text2vec-base-chinese/files

这里不作详细说明，开发者需要自行学习Milvus向量数据库的使用。笔者是从ES里加载了部分二级市场的舆情数据到Milvus。

Milvus新闻库中如果有的新闻内容大模型一般都能回复正确。

关注