faiss向量练习

最新推荐文章于 2024-03-19 09:37:18 发布

梦无痕123

最新推荐文章于 2024-03-19 09:37:18 发布

阅读量242

点赞数

分类专栏：随笔文章标签： python 开发语言后端

本文链接：https://blog.csdn.net/lb521200200/article/details/123097596

版权

随笔专栏收录该内容

43 篇文章 1 订阅

订阅专栏

Faiss的全称是Facebook AI Similarity Search，是FaceBook的AI团队针对大规模相似度检索问题开发的一个工具，使用C++编写，有python接口，对10亿量级的索引可以做到毫秒级检索的性能。

安装：install faiss-cpu -c pytorch

第一个例子：

#第一步构建向量
import numpy as np
d = 64 # 向量维度
nb = 100000 # index向量库的数据量
nq = 10000 # 待检索query的数目
np.random.seed(1234)
xb = np.random.random((nb, d)).astype('float32')
xb[:, 0] += np.arange(nb) / 1000. # index向量库的向量
xq = np.random.random((nq, d)).astype('float32')
xq[:, 0] += np.arange(nq) / 1000. # 待检索的query向量
#第二步，构建索引，这里我们选用暴力检索的方法FlatL2，L2代表构建的index采用的相似度度量方法为L2范数，即欧氏距离：
import faiss
index = faiss.IndexFlatL2(d)
print(index.is_trained) # 输出为True，代表该类index不需要训练，只需要add向量进去即可
index.add(xb) # 将向量库中的向量加入到index中
print(index.ntotal) # 输出index中包含的向量总数，为100000
#第三步，检索TopK相似query：
k = 4 # topK的K值
D, I = index.search(xq, k)# xq为待检索向量，返回的I为每个待检索query最相似TopK的索引list，D为其对应的距离
print(I[:5])
print(D[-5:])

梦无痕123

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
faiss向量练习

Faiss的全称是Facebook AI Similarity Search，是FaceBook的AI团队针对大规模相似度检索问题开发的一个工具，使用C++编写，有python接口，对10亿量级的索引可以做到毫秒级检索的性能。安装：install faiss-cpu -c pytorch第一个例子：#第一步构建向量import numpy as npd = 64 # 向量维度nb = 100000...
复制链接

扫一扫