大模型 搭建知识库 RAG

介绍

LLM具有强大的语言理解和生成能力,当下存在一些局限性,失效受制、专业能力有限和定制成本高。有两种开发范式RAG(实时更新)和Finetune(个性化微调)。
RAG 检索增强生成
在这里插入图片描述
基于langchain搭建rag应用
在这里插入图片描述
构建向量数据库
在这里插入图片描述
搭建知识库助手
在这里插入图片描述
在这里插入图片描述
基于gradio的web部署

基础作业-复现知识库助手搭建过程

进入 conda 环境之后,使用以下命令从本地一个已有的 pytorch 2.0.1 的环境,然后使用以下命令激活环境

bash
/root/share/install_conda_env_internlm_base.sh InternLM
conda activate InternLM

在这里插入图片描述

在环境中安装运行 demo 所需要的依赖

python -m pip install --upgrade pip
pip install modelscope==1.9.5
pip install transformers==4.35.2
pip install streamlit==1.24.0
pip install sentencepiece==0.1.99
pip install accelerate==0.24.1

在这里插入图片描述

模型下载

mkdir -p /root/data/model/Shanghai_AI_Laboratory
cp -r /root/share/temp/model_repos/internlm-chat-7b /root/data/model/Shanghai_AI_Laboratory/internlm-chat-7b

在这里插入图片描述
在已完成 InternLM 的部署基础上,还需要安装LangChain 依赖包

pip install langchain==0.0.292
pip install gradio==4.4.0
pip install chromadb==0.4.15
pip install sentence-transformers==2.2.2
pip install unstructured==0.10.30
pip install markdown==3.3.7
pip install -U huggingface_hub

在这里插入图片描述
通过huggingface下载开源词向量模型 Sentence Transformer
在这里插入图片描述
下载 NLTK 相关资源

cd /root
git clone https://gitee.com/yzy0612/nltk_data.git  --branch gh-pages
cd nltk_data
mv packages/*  ./
cd tokenizers
unzip punkt.zip
cd ../taggers
unzip averaged_perceptron_tagger.zip

在这里插入图片描述
下载本项目代码

cd /root/data
git clone https://github.com/InternLM/tutorial

在这里插入图片描述
数据收集

收集数据

cd /root/data
git clone https://gitee.com/open-compass/opencompass.git
git clone https://gitee.com/InternLM/lmdeploy.git
git clone https://gitee.com/InternLM/xtuner.git
git clone https://gitee.com/InternLM/InternLM-XComposer.git
git clone https://gitee.com/InternLM/lagent.git
git clone https://gitee.com/InternLM/InternLM.git

在这里插入图片描述
构建知识库
在这里插入图片描述
InternLM 接入 LangChain
在这里插入图片描述

构建检索问答链并运行
在这里插入图片描述
将服务器端口映射到本地端口
在这里插入图片描述
打开网页
在这里插入图片描述

进阶作业

我来制作一个讲故事的机器人
1、收集故事
在这里插入图片描述

2、构建知识向量库
在这里插入图片描述
3、运行web 测试下
在这里插入图片描述

  • 7
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值