Qdrant 向量数据库的简单使用

1 概述

本文将通过 Qdrant 的 python 客户端库 qdrant-client 来简单操作一下 Qdrant 向量数据库。

2 Qdrant 的使用

2.1 引入 Qdrant 的 python 客户端库

引入 qdrant_client 版本 为 1.10.1 的 Qdrant 的 python 客户端库。

pip install qdrant-client

2.2 创建和启动 Qdrant 数据库

项目启动时,创建并启动一个Qdrant数据库,数据持久化到磁盘,数据存储地址为“/Users/Shared/data/qdrant”。

from qdrant_client import QdrantClient

client = QdrantClient(path="/Users/Shared/data/qdrant")

2.3 创建数据集

创建一个名称为 test_collection 的数据集(类似于mysql中的表)。其中向量维度为4维,相似度计算方式使用向量点积相似度-Distance.DOT。

from qdrant_client.models import Distance, VectorParams

def create_collection():
    client.create_collection(
        collection_name="test_collection",
        vectors_config=VectorParams(size=4, distance=Distance.DOT),
    )

2.4 新增向量数据 

往 test_collection 数据集中新增向量数据。其中 vector 为向量数据对应的向量,payload 为向量数据对应的负载,是附加在向量上的数据,在搜索过程中可用于过滤或排序结果。

from qdrant_client.models import PointStruct

def add_vectors():
    operation_info = client.upsert(
        collection_name="test_collection",
        wait=True,
        points=[
            PointStruct(id=1, vector=[0.05, 0.61, 0.76, 0.74], payload={"city": "Berlin"}),
            PointStruct(id=2, vector=[0.19, 0.81, 0.75, 0.11], payload={"city": "London"}),
            PointStruct(id=3, vector=[0.36, 0.55, 0.47, 0.94], payload={"city": "Moscow"}),
            PointStruct(id=4, vector=[0.18, 0.01, 0.85, 0.80], payload={"city": "New York"}),
            PointStruct(id=5, vector=[0.24, 0.18, 0.22, 0.44], payload={"city": "Beijing"}),
            PointStruct(id=6, vector=[0.35, 0.08, 0.11, 0.44], payload={"city": "Mumbai"}),
        ],
    )

    print(operation_info)

2.5 简单查询

根据向量查询最相似的前n条向量数据。

def query():
    search_result = client.search(
        collection_name="test_collection", query_vector=[0.2, 0.1, 0.9, 0.7], limit=3, with_vectors=True
    )

    print(search_result)

 查询结果如下:

[ScoredPoint(id=4, version=0, score=1.362, payload={'city': 'New York'}, vector=[0.18, 0.01, 0.85, 0.8], shard_key=None, order_value=None), ScoredPoint(id=1, version=0, score=1.2730000000000001, payload={'city': 'Berlin'}, vector=[0.05, 0.61, 0.76, 0.74], shard_key=None, order_value=None), ScoredPoint(id=3, version=0, score=1.208, payload={'city': 'Moscow'}, vector=[0.36, 0.55, 0.47, 0.94], shard_key=None, order_value=None)]

2.6 filter查询

根据向量+负载过滤查询最相似的前n条向量数据。

(1) MatchValue 精确查询

from qdrant_client.models import Filter, FieldCondition, MatchValue

def query_with_filter():
    search_result = client.search(
        collection_name="test_collection",
        query_vector=[0.2, 0.1, 0.9, 0.7],
        query_filter=Filter(
            must=[FieldCondition(key="city", match=MatchValue(value="Beijing"))]
        ),
        with_vectors=True,
        limit=3,
    )

    print(search_result)

 查询结果如下:

[ScoredPoint(id=5, version=0, score=0.5720000000000001, payload={'city': 'Beijing'}, vector=[0.24, 0.18, 0.22, 0.44], shard_key=None, order_value=None)]

(2)MatchText 模糊查询

def query_with_filter_fuzzy():
    search_result = client.search(
        collection_name="test_collection",
        query_vector=[0.2, 0.1, 0.9, 0.7],
        query_filter=Filter(
            must=[FieldCondition(key="city", match=MatchText(text="jin"))]
        ),
        with_vectors=True,
        limit=3,
    )

    print(search_result)

查询结果如下:

[ScoredPoint(id=5, version=0, score=0.5720000000000001, payload={'city': 'Beijing'}, vector=[0.24, 0.18, 0.22, 0.44], shard_key=None, order_value=None)]

3 参考文献

(1)https://github.com/qdrant/qdrant

(2)Local Quickstart - Qdrant

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Qdrant 是一种开源的快速搜索引擎,主要用于实时高效的向量搜索。以下是关于如何使用 Qdrant简单步骤: 1. 安装 Qdrant:打开终端或命令提示符,输入适当的命令来安装 Qdrant。具体命令取决于你使用的操作系统和安装方式。可以参考 Qdrant 官方文档或 GitHub 页面获取更多安装指引。 2. 配置 Qdrant:在安装完成后,你需要进行一些配置,以便 Qdrant 能够与你的数据一起工作。这包括设置数据存储路径、索引参数和其他选项。通过编辑配置文件,根据你的需求进行相应的调整。 3. 导入数据:在配置完成后,你需要将需要搜索的数据加载到 Qdrant 中。Qdrant 支持各种数据类型,包括向量和标量数据。你可以将数据保存在 JSON 或 CSV 格式的文件中,并使用相应的命令将其导入到 Qdrant 中。 4. 创建索引:在导入数据后,你需要创建索引以便进行快速搜索使用 Qdrant 提供的创建索引的命令,指定索引的名称、数据集和其他参数。Qdrant 将扫描导入的数据,并根据所提供的参数生成高效的索引。 5. 进行搜索:一旦索引创建完成,你就可以开始使用 Qdrant 进行搜索了。通过 Qdrant 提供的搜索命令,你可以输入搜索向量或关键词,并指定需要搜索的索引。Qdrant 将返回与搜索条件匹配的结果,并按照相似度进行排序。 6. 其他功能:除了基本的搜索功能外,Qdrant 还提供了其他强大的功能,如实时更新数据、删除数据、优化索引等。你可以通过查阅文档或参考示例代码来了解更多相应的命令和用法。 总结来说,使用 Qdrant 的基本步骤包括安装、配置、导入数据、创建索引和进行搜索。随着对 Qdrant 的熟悉程度的提高,你可以深入了解和利用其更多的功能来满足不同的搜索需求。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值