书生·浦语实战营第三期基础部分(Llamaindex RAG实践)
任务要求:
- 基于 LlamaIndex 构建自己的 RAG 知识库,寻找一个问题 A 在使用 LlamaIndex 之前InternLM2-Chat-1.8B模型不会回答,借助 LlamaIndex 后 InternLM2-Chat-1.8B 模型具备回答 A 的能力,截图保存。
初始模型:
Prompt: THQA是什么?
显然,大模型并不知道THQA是什么。
RAG:
- 将github中THQA仓库的readme文件作为额外参考语料:
- 使用Llamaindex对额外参考语料进行分词、检索
- 重新提问模型:THQA是什么?
此时大模型已经能够反映出新增语料内容。
项目参考:
[1] https://github.com/InternLM/Tutorial/tree/camp3/docs/L1/LlamaIndex
[2] https://github.com/zyj-2000/THQA