使用元数据过滤器优化向量索引查询
在将文档扔进向量索引之前,为它们附加元数据是一个非常有用的技巧。这些元数据不仅可以用于帮助跟踪响应对象中的答案来源,还可以在查询时用于过滤数据,从而在执行top-k相似度搜索之前排除不必要的数据。
元数据过滤器可以手动设置,以便只返回匹配元数据的节点。下面是一个具体的示例:
from llama_index.core import VectorStoreIndex, Document
from llama_index.core.vector_stores import MetadataFilters, ExactMatchFilter
# 创建包含元数据的文档
documents = [
Document(text=