书生大模型实战营基础岛 - LlamaIndex RAG 实践

最新推荐文章于 2024-08-13 18:29:56 发布

J_M_Kirito

最新推荐文章于 2024-08-13 18:29:56 发布

阅读量246

点赞数 4

文章标签： python 人工智能

本文链接：https://blog.csdn.net/J_M_Kirito/article/details/141105701

版权

任务描述

复现截图

任务描述

基于 LlamaIndex 构建自己的 RAG 知识库，寻找一个问题 A 在使用 LlamaIndex 之前InternLM2-Chat-1.8B模型不会回答，借助 LlamaIndex 后 InternLM2-Chat-1.8B 模型具备回答 A 的能力，截图保存。

复现截图

首先创建30%的开发机，配置环境，安装相关依赖，下载Sentence Transformer模型进行RAG Embedding：

conda create -n llamaindex python=3.10
conda activate llamaindex
conda install pytorch==2.0.1 torchvision==0.15.2 torchaudio==2.0.2 pytorch-cuda=11.7 -c pytorch -c nvidia
pip install einops
pip install  protobuf
conda activate llamaindex
pip install llama-index==0.10.38 llama-index-llms-huggingface==0.2.0 "transformers[torch]==4.41.1" "huggingface_hub[inference]==0.23.1" huggingface_hub==0.23.1 sentence-transformers==2.7.0 sentencepiece==0.2.0
cd ~
mkdir llamaindex_demo
mkdir model
cd ~/llamaindex_demo
touch download_hf.py

download_hf.py内容如下：

import os

# 设置环境变量
os.environ['HF_ENDPOINT'] = 'https://hf-mirror.com'

# 下载模型
os.system('huggingface-cli download --resume-download sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2 --local-dir /root/model/sentence-transformer')

下载nltk相关资源：

cd /root
git clone https://gitee.com/yzy0612/nltk_data.git  --branch gh-pages
cd nltk_data
mv packages/*  ./
cd tokenizers
unzip punkt.zip
cd ../taggers
unzip averaged_perceptron_tagger.zip

然后我们运行一下，问问模型什么是xtuner：

这里我们看到由于xtuner比较新，模型并没有准确描述出来，而是称之为音乐播放软件。

开始RAG，先安装安装 LlamaIndex 词嵌入向量依赖，然后把xtuner仓库的readme作为知识库：

然后再运行进行提问，回答正确！：

J_M_Kirito

关注

4
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
书生大模型实战营基础岛 - LlamaIndex RAG 实践

基于 LlamaIndex 构建自己的 RAG 知识库，寻找一个问题 A 在使用 LlamaIndex 之前InternLM2-Chat-1.8B模型不会回答，借助 LlamaIndex 后 InternLM2-Chat-1.8B 模型具备回答 A 的能力，截图保存。这里我们看到由于xtuner比较新，模型并没有准确描述出来，而是称之为音乐播放软件。然后再运行进行提问，回答正确！开始RAG，先安装安装。
复制链接

扫一扫