环境准备
可以参考这个做环境安装。https://github.com/InternLM/Tutorial/blob/camp3/docs/L1/LlamaIndex/readme.md
基于 LlamaIndex 构建自己的 RAG 知识库,寻找一个问题 A 在使用 LlamaIndex 之前InternLM2-Chat-1.8B模型不会回答,借助 LlamaIndex 后 InternLM2-Chat-1.8B 模型具备回答 A 的能力
做rag之前,没有检索xtuner文档,纯靠模型本身能力,无法正确回答“xtuner是什么?”
rag原理是基于llamaindex,把xtuner文档转换为向量,创建一个查询引擎,这个引擎可以接收查询。当查询内网也向量化后,和文档内容做相似性匹配,把匹配的文档内容和查询内容一起输给大模型,获取模型答案。
做完rag之后,可以正确回答“xtuner是什么?”