Milvus 核心设计 (3) ---- metric及index原理详解与示例(1)

目录

背景

Floating point embeddings

特点

适用场景

丈量方式

Euclidean distance (L2)

Inner product (IP)

Cosine similarity (COSINE)

代码写法

索引类型

In-Memory

FLAT 索引

IVF_FLAT

IVF_FLAT的工作流程

平衡准确性与速度

性能考虑

代码写法

IVF_SQ8

原理

参数

代码

适用性小结

IVF_PQ

原理

参数

代码

HNSW

原理

参数

In-GPU

GPU_IVF_FLAT

原理

不同点

GPU_IVF_PQ

In-Disk

DISKANN

原理

feature 配置位置

limitation

代码

finetune


背景

作为向量数据库的重要核心概念,引入与适用场景匹配的相似度,在search 或 query 时至关重要。在前面讲述 Chroma 的相似度计算时,已经说清楚了 Cosine,IP, l2 三种相似度计算的不用及适用场景。Milvus 在相似度的匹配中,也包含了这些核心概念,但应该说 Milvus 在这方面考虑得更细致一些, 下面看下Milvus 在这方面的使用。

Chroma 更加侧重于轻量级的,LLM领域的 vector store 与 search,所以Chroma 更加关注的是 floating vector 的存储。因为熟悉 LLM embedding 的都应该很清楚,无论你使用何种 embedding 模型,包括 google  transfomer,或是其他你在 mode scope 上下载的 embedding model,句子在 embedding 后肯定是一个 dim 维度的 float类型的向量。正因为如此,Chroma 的重点在关注 float vector 的embedding 上。所以还是那句话,应用场景决定了软件设计。

但Milvus 在关注 LLM 的 vector store 与 query 时,同时也关注 Binary 与 Sparse

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

PhoenixAI8

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值