query contraction是指将用户的复杂查询简化或重新表达,以便更有效地进行检索。这种方法可以帮助克服基于距离的相似性搜索的一些限制,通过生成多个视角来更全面地理解用户的问题。
Query structuring for metadata filters
这里先解释一下什么是metadata,元数据(meta-data)是关于数据的数据。它提供了有关其他数据的信息或描述,使得数据管理、搜索和检索更加高效。元数据可以包括数据的来源、创建时间、修改时间、格式、大小、作者等属性。
许多向量库都包含元数据字段。这使得基于元数据过滤特定块成为可能。让我们看看我们可能在YouTube转录本数据库中看到的一些元数据示例。
Flow:
实现
首先先获取数据
from langchain_community.document_loaders import YoutubeLoader
docs = YoutubeLoader.from_youtube_url(
"<https://www.youtube.com/watch?v=pbAd8O1Lvm4>", add_video_info=True
).load()
docs[0].metadata
数据结果:{'source': 'pbAd8