目录
LLM私域数据训练问题
LLM在人类和数据之间提供自然语言界面。广泛可用的模型是根据大量公开数据(如维基百科、邮件列表、教科书、源代码等)进行预先训练的。
然而,虽然LLM接受了大量数据的培训,但他们并没有接受您的数据的培训,这些数据可能是私有的或特定于您试图解决的问题。它隐藏在 API 后面、SQL 数据库中,或者隐藏在 PDF 和幻灯片中。
什么是LlamaIndex
LlamaIndex 通过连接到多种数据源并将您的数据添加到 LLM 已有的数据中来解决外部数据训练问题。这通常称为检索增强生成(RAG)。RAG 使您能够使用 LLM 来查询数据、转换数据并生成新的见解。您可以询问有关数据的问题、创建聊天机器人、构建半自治代理等等。
提供的工具
-
数据连接器从其本机源和格式获取现有数据。这些可以是 API、PDF、SQL 等等。
-
数据索引以中间表示形式构建数据,这些中间表示形式对于LLM来说既简单又高效。
-
引擎提供