langchain-chatglm搭建与测试

  在之前的chatglm基于ptuning微调训练的实验中,由于数据量较小,调试效果并不理想。同时,数据需要符合prompt的jsonl格式,而短时间内整理出合适的项目训练数据并不容易。然而,在社区中了解到了langchain基于本地知识库的问答功能,这让我豁然开朗,或许我也可以自己搭建一个本地知识库,直接导入本地文件,从而实现本地知识库的问答功能。这样,我只需导入一部小说,就能让系统理解小说内容,并回答相关问题。这个想法一出现,我便立即行动起来,趁着GPU云服务器还有8天的使用期,充分利用这段时间。

什么是langchain

  LangChain是一个用于构建基于大型语言模型(LLM)的应用程序的库。它为开发者提供了一种便捷的方式,可以将LLM与其他计算或知识源结合起来,从而创造出更加智能和强大的应用程序。LangChain的目标是帮助开发者充分发挥大型语言模型的优势,使其在各种领域,如自然语言处理、问答系统、文本生成等方面得到更广泛的应用。通过LangChain,开发者可以更高效地利用大型语言模型的能力,为用户提供更优质的智能化体验。例如,开发者可以使用LangChain将大型语言模型与电子商务网站集成,导入人工客服的对话问答库和商品介绍文档,为用户提供智能的商品推荐和个性化购物建议。

下载源码

  既然之前能够运行chatglm-6b的模型,那么我们仍然基于chatglm模型来搭建属于自己的本地知识库。先下载langchain-ChatGLM源码。

root@VM-0-17-ubuntu:~# git clone https://github.com/chatchat-space/langchain-ChatGLM.git

环境准备

  之前已经成功运行了chatglm模型,那么,还是基于python3.8的版本来构建自己的langchain,创建python虚拟环境, 并激活:

root@VM-0-17-ubuntu:~# conda create -n langchain python=3.8
root@VM-0-17-ubuntu:~# conda activate langchain

  在虚拟python环境中,更新py库,并下载langchain的依赖:

root@VM-0-17-ubuntu:~# pip3 install --upgrade pip
# 项目中 pdf 加载由先前的 detectron2 替换为使用 paddleocr,如果之前有安装过 detectron2 需要先完成卸载避免引发 tools 冲突
root@VM-0-17-ubuntu:~# pip uninstall detectron2
# 检查paddleocr依赖,linux环境下paddleocr依赖libX11,libXext
root@VM-0-17-ubuntu:~# apt-get install libx11-dev libxext-dev libxtst-dev libxrender-dev libxmu-dev libxmuu-dev

  进入langchain工程,下载依赖:

root@VM-0-17-ubuntu:~# cd langchain-ChatGLM
root@VM-0-17-ubuntu:langchain-ChatGLM# pip install -r requirements.txt

  检查paddleocr是否成功,首次运行会下载约18M模型到~/.paddleocr

root@VM-0-17-ubuntu:langchain-ChatGLM# python loader/image_loader.py
root@VM-0-17-ubuntu:langchain-ChatGLM# du -sh ~/.paddleocr/
# 输出 18M     /root/.paddleocr/ 说明验证成功

llama-cpp模型调用的说明

  我们虽然没有指定使用llama-cpp的模型,但langchain依赖llama-cpp-python的包,因此需要安装llama-cpp-python。

root@VM-0-17-ubuntu:langchain-ChatGLM# pip install llama-cpp-python

  注意,这里依赖gcc的版本那是8.4及以上,系统自带的gcc是7.5版本,因此会报错。需要先升级

  更新软件包列表:

root@VM-0-17-ubuntu:langchain-ChatGLM# apt update -y
root@VM-0-17-ubuntu:langchain-ChatGLM# apt install gcc-8 g++-8

  更新系统的默认gcc版本为8.4:

root@VM-0-17-ubuntu:langchain-ChatGLM# sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-8 100
root@VM-0-17-ubuntu:langchain-ChatGLM# sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-8 100

  验证gcc版本是否升级成功:

root@VM-0-17-ubuntu:langchain-ChatGLM# gcc --version

模型选择

  检查langchain-ChatGLM默认使用的模型,打开configs/model_config.py ,可以看到支持的模型列表:

root@VM-0-17-ubuntu:langchain-ChatGLM# vim configs/model_config.py
llm_model_dict = { 
    ......
    "chatglm-6b": {
        "name": "chatglm-6b",
        "pretrained_model_name": "/root/prj/ChatGLM-6B/THUDM/chatglm-6b",
        "local_model_path": None,
        "provides": "ChatGLMLLMChain"
    },  
   ......
    "chatglm2-6b-32k": {
        "name": "chatglm2-6b-32k",
        "pretrained_model_name": "/root/prj/ChatGLM-6B/THUDM/chatglm2-6b-32k",
        "local_model_path": None,
        "provides": "ChatGLMLLMChain"
    },  
    ......
}
LLM_MODEL = "chatglm2-6b-32k" # 默认模型

  从上述代码中,我们可以看到,既支持了chatglm-6b,还支持了更高能力的chatglm2-6b-32k。chatglm2-6b-32k是在ChatGLM2-6B的基础上进一步强化了对于长文本的理解能力,能够更好的处理最多32K长度的上下文。既然有更好的模型,而且默认还是这个,为啥不用最新的呢(其实是chatglm-6b尝试失败了,出现了我无法解决的问题,大概率是版本太老,资源丢失了).

模型下载

chatglm-6b-32k下载

Hugging Face – The AI community building the future.搜索chatglm-6b-32k,链接为:THUDM/chatglm2-6b-32k · Hugging Face从截图中可以看出,chatglm-6b-32k的模型大概有15G左右,我们可以执行以下命令来下载模型:

root@VM-0-17-ubuntu:langchain-ChatGLM# git lfs clone https://huggingface.co/THUDM/chatglm2-6b-32k

  如果没钱的小伙伴,可以去我的百度云盘下载,这个就不保证实时更新了哦。

链接:https://pan.baidu.com/s/1FWH986DG7ZzOsU1vyqTW2g 
提取码:1kou 

text2vec-large-chinese 汉语长文本下载

  chatglm-6b-32k还依赖汉语长文本的模型,否则运行langchain会重新去下载text2vec-large-chinese的模型文件,我们可以提前下载。仍然在https://huggingface.co搜索,得到链接GanymedeNil/text2vec-large-chinese at main

  网盘下载:

链接:https://pan.baidu.com/s/1UtQqM8SR33nilYtszE-IZQ 
提取码:yxnz 

配置

  模型文件下载好后,需要对应自己的模型路径进行配置,打开configs/model_config.py如下,根据注释进行配置:

......
embedding_model_dict = { 
    "ernie-tiny": "nghuyong/ernie-3.0-nano-zh",
    "ernie-base": "nghuyong/ernie-3.0-base-zh",
    "text2vec-base": "shibing624/text2vec-base-chinese",
    #"text2vec": "GanymedeNil/text2vec-large-chinese",
    "text2vec": "/root/prj/ChatGLM-6B/THUDM/text2vec-large-chinese",                   # 下载好的text2vec-large-chinese路径
    "text2vec-base-multilingual": "shibing624/text2vec-base-multilingual",
    "text2vec-base-chinese-sentence": "shibing624/text2vec-base-chinese-sentence",
    "text2vec-base-chinese-paraphrase": "shibing624/text2vec-base-chinese-paraphrase",
    "m3e-small": "moka-ai/m3e-small",
    "m3e-base": "moka-ai/m3e-base",
}
......
llm_model_dict = { 
    ......
    "chatglm2-6b-32k": {
        "name": "chatglm2-6b-32k",
        "pretrained_model_name": "/root/prj/ChatGLM-6B/THUDM/chatglm2-6b-32k",         # 下载好的chatglm2-6b-32k路径
        "local_model_path": None,
        "provides": "ChatGLMLLMChain"
    },
    ......
}

执行脚本体验 Web UI

  执行 webui.py 脚本体验 Web 交互

root@VM-0-17-ubuntu:langchain-ChatGLM# python webui.py

  执行结果如下则证明启动成功:

  打开浏览器,显示如下,可以看到有基于LLM的对话,知识库的问答,以及Bing搜索问答:

  我们先使用基础模型进行测试,如下图,可以看到基础模型的对话能够满足对话需求,由此可见,对于语义语境都能表现的不错:

  接下来我们测试知识库,在右边新增test知识库,基于test知识库,上传天龙八部的据集(tianlongbabu.txt),然后在左边进行问答,效果如下:

  从效果来看,本地知识库问答系统只是在知识库txt中找到了类似的语句作为答案,没有进行总结和提炼,效果令人不满意。可能是因为使用方法不对,或者有其他高级功能尚未开放。我会继续追踪langchain的能力,学习如何正确使用本地知识库,期待未来的改进。同时,我也希望对AI感兴趣且了解深入的专家能够给予指导,我们可以一起交流,共同探讨。

总结

  langchain-ChatGLM是一个引人注目的项目,它为开发者提供了一个强大的工具,使他们能够构建基于大型语言模型(LLM)的问答系统。在使用langchain-ChatGLM的过程中,我发现了一些优点和一些改进的空间。

  首先,langchain-ChatGLM的安装非常简单,只需按照提供的教程一步步操作即可完成安装。它允许用户快速上手,不需要繁琐的配置,为开发者节省了时间和精力。

  其次,langchain-ChatGLM的教程非常清晰易懂。开发者可以轻松理解每一步的操作,并快速构建起一个本地知识库问答系统。这样的用户体验使得langchain-ChatGLM成为一个初学者友好的工具。

  然而,尽管langchain-ChatGLM提供了一种便捷的搭建方式,但其本地知识库问答功能并不尽如人意。在测试过程中,我发现系统对于复杂问题的理解和回答还有一定的欠缺。这可能与数据量和模型的规模有关,但仍然希望在未来的版本中能够对此进行优化。

  总的来说,langchain-ChatGLM是一个有潜力的项目,它为开发者提供了一个简单而有效的方式来构建基于大型语言模型的问答系统。尽管目前本地知识库问答功能还有改进的空间,但我期待着未来版本的优化,希望能够看到更出色的表现。在不断进步和改进中,langchain-ChatGLM有望成为一款更加优化和强大的产品。

  • 24
    点赞
  • 37
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值