相关理论介绍
可参考RAG综述
“Retrieval-Augmented Generation for Large Language Models: A Survey”
实战篇:
根据以下链接中搭建llamaindex环境
https://github.com/wuwulin/Tutorial/tree/camp3/docs/L1/LlamaIndex
最终根据以下指令执行llamaindex_internlm.py文件时
conda activate llamaindex
cd ~/llamaindex_demo/
python llamaindex_internlm.py
报错,提示"protobuf库未安装"(不知道是我哪个环节出了问题,别人好像没出现这种问题),然后又通过"pip install protobuf"指令安装protobuf库
之后问题消失,运行代码成功
由于训练internlm2-chat-1_8b模型时候,xtuner框架还没出来,模型就没有xtuner的知识库,基于internlm2-chat-1_8b的问答系统给不出正确的答案
之后通过RAG技术,利用github上xtuner工程中readme中的资料作为知识,利用相对轻量、支持中文且效果较好的开源词向量模型
paraphrase-multilingual-MiniLM-L12-v2进行向量化
运行llamaindex_RAG.py程序后,对话系统给出了正确的回答