LlamaIndex 是什么?
从字面上理解,是 Llama + Index,Llama 是大语言模型,Index 是索引,Index for Llama 就是为大语言模型做索引,那么大语言模型为什么需要索引,索引的作用是什么?
我们先看大语言模型都有什么,大语言模型主要分为开源还是闭源两个阵营,开源包括 Qwen 、Llama、Gemma 等模型,闭源包括文心一言、ChatGPT、Gemini 等模型。大语言模型都是预训练模型,各模型在已有数据集上进行训练,这种通用模型通常都具备全域知识,普遍的问题都可以进行问答。但是对于最新的知识,或者一些专有知识,模型就会出现幻觉或者回答不正确的情况。如果想要让模型更新知识或者采用私域知识,最直接的方法就是对模型进行训练,训练需要具备一定的经验,需要数据和提供相应的计算资源。
什么是 RAG
有没有其他相对容易并节省资源的方式呢?答案是肯定的,RAG 是一种被普遍采用的策略,RAG (Retrieval-Augmented Gener