38 LlamaIndex查询转换：优化查询处理 (HyDE 多步查询分解)

最新推荐文章于 2024-10-28 23:10:40 发布

需要重新演唱

最新推荐文章于 2024-10-28 23:10:40 发布

阅读量409

点赞数 4

分类专栏： llamindex文章文章标签： LLM llamaindex RAG 算法人工智能

本文链接：https://blog.csdn.net/xycxycooo/article/details/141352751

版权

llamindex文章专栏收录该内容

162 篇文章 6 订阅

订阅专栏

LlamaIndex查询转换：优化查询处理

在LlamaIndex中，查询转换功能允许你对索引结构进行查询转换。查询转换模块会将一个查询转换为另一个查询。它们可以是单步的，即在查询执行之前只运行一次转换；也可以是多步的，即查询被转换并执行，响应被检索，然后后续查询以顺序方式进行转换和执行。

使用场景

查询转换有多种使用场景：

转换初始查询为更易嵌入的形式（例如HyDE）
将初始查询转换为更容易从数据中回答的子问题（单步查询分解）
将初始查询分解为多个更容易单独回答的子问题（多步查询分解）

HyDE（Hypothetical Document Embeddings）

HyDE是一种技术，给定一个自然语言查询，首先生成一个假设的文档/答案。然后使用这个假设文档进行嵌入查找，而不是原始查询。

使用HyDE的示例代码

from llama_index.core import VectorStoreIndex, SimpleDirectoryReader
from llama_index.core.indices.query.query_transform.base import (
    HyDEQueryTransform,
)
from llama_index.core.query_engine import TransformQueryEngine

# 加载文档，构建索引
documents = SimpleDirectoryReader("../paul_graham_essay/data").load_data()
index = VectorStoreIndex(documents)

# 使用HyDE查询转换运行查询
query_str = "what did paul graham do after going to RISD"
hyde = HyDEQueryTransform(include_original=True)
query_engine = index.as_query_engine()
query_engine = TransformQueryEngine(query_engine, query_transform=hyde)
response = query_engine.query(query_str)
print(response)

查看我们的示例笔记本，了解完整流程。

多步查询转换

多步查询转换是现有单步查询转换方法的泛化。

给定一个初始的复杂查询，查询被转换并执行。响应从查询中检索。根据响应（以及先前的响应）和查询，可能会对索引提出后续问题。这种技术允许查询在单个知识源上运行，直到该查询满足所有问题。

示例图像

在这里插入图片描述

对应示例代码

from llama_index.core.indices.query.query_transform.base import (
    StepDecomposeQueryTransform,
)

# gpt-4
step_decompose_transform = StepDecomposeQueryTransform(llm, verbose=True)

query_engine = index.as_query_engine()
query_engine = MultiStepQueryEngine(
    query_engine, query_transform=step_decompose_transform
)

response = query_engine.query(
    "Who was in the first batch of the accelerator program the author started?",
)
print(str(response))