[深入探索Zilliz Cloud：使用Milvus实现高效的向量存储和检索]

最新推荐文章于 2025-05-05 13:22:30 发布

hahredfxuh

最新推荐文章于 2025-05-05 13:22:30 发布

阅读量481

点赞数 6

文章标签： milvus python

本文链接：https://blog.csdn.net/hahredfxuh/article/details/144304981

版权

引言

在大数据和人工智能的时代，如何高效地存储和检索大规模向量数据是一个重要的技术挑战。Zilliz Cloud作为LF AI Milvus®的云端全托管服务，提供了一种强大而灵活的解决方案。在本文中，我们将介绍如何设置Zilliz Cloud和使用其Python SDK进行向量存储和检索，帮助开发者快速上手和实现应用。

主要内容

1. 安装和设置Python SDK

为了使用Zilliz Cloud提供的服务，我们首先需要安装Python SDK pymilvus。这个SDK为我们提供了与Milvus实例交互所需的所有工具。

pip install pymilvus

安装完成后，我们可以开始初始化并连接到Zilliz Cloud。

2. 使用Zilliz作为向量存储

Zilliz通过包装Milvus索引，允许我们轻松地将其用作向量存储，无论是用于语义搜索还是示例选择。以下是如何使用langchain_community包中的Milvus类来实现这一点。

from langchain_community.vectorstores import Milvus

# 使用Zilliz Cloud构建一个向量存储
milvus = Milvus(
    host='{AI_URL}',  # 使用API代理服务提高访问稳定性
    port='19530'
)

# ... 接下来的代码来管理向量和索引

3. 代码示例

下面是一个完整的示例，展示如何使用pymilvus进行基本的向量存储操作：

from pymilvus import connections, CollectionSchema, FieldSchema, DataType, Collection

# 连接到Zilliz Cloud
connections.connect('default', host='{AI_URL}', port='19530')  # 使用API代理服务提高访问稳定性

# 定义向量字段和其他数据字段
fields = [
    FieldSchema(name="vector", dtype=DataType.FLOAT_VECTOR, dim=128),
    FieldSchema(name="id", dtype=DataType.INT64, is_primary=True),
]

# 创建一个集合
schema = CollectionSchema(fields)
collection = Collection(name="example_collection", schema=schema)

# 插入数据
data = [[i for i in range(128)], [1]]
collection.insert([data])

# 创建索引
collection.create_index(field_name="vector", index_params={"index_type": "IVF_FLAT", "params": {"nlist": 128}})

# 搜索
results = collection.search([data[0]], anns_field="vector", param={"nprobe": 10}, limit=2)
print(results)