这么多向量数据库，它们之间到底有哪些差异？

最新推荐文章于 2024-06-17 16:23:31 发布

前行的七哥

最新推荐文章于 2024-06-17 16:23:31 发布

阅读量606

点赞数 9

分类专栏： LLM应用开发与落地文章标签：人工智能数据库

本文链接：https://blog.csdn.net/wolf711988/article/details/136272604

版权

LLM应用开发与落地专栏收录该内容

6 篇文章 2 订阅

订阅专栏

上篇说到chroma的近邻搜索算法实现得有问题，不如qdrant的。其实向量数据库之间看似都一样，但细细比较还是有很多不同的。

国外有一系列文章已经讲得很详细了，而且也就是半年前写的，还是具有很强的参考价值，文章如下：

Vector databases (1): What makes each one different?

Vector databases (2): Understanding their internals

Vector databases (3): Not all indexes are created equal

Vector databases (4): Analyzing the trade-offs

里边有很多细节，不想细看的，我这里给几张图给大家快速了解不同向量数据库的差异。

存在时间

实现语言及是否开源

托管方法

索引方法

向量压缩的概念

向量一般是由浮点数组成，比如float32。一个float32 占4个字节，当向量维度很高且向量很多时，向量存储空间会比较大，查询起来也会比较慢。优化的一种方式是压缩向量，比如改成用一个byte的整数来表示原来的float32。这样每个维度就从4个字节变成一个字节，存储空间变小，查询也变快。当然，压缩会损失精度，可能会导致求向量相似度的时候有误差。向量压缩的过程叫量化(Quantization）

上图中的Flat 表示按向量的原始方式存储向量，没有压缩。压缩的方式有标量量化Scalar Quantization (SQ) 和乘积量化 Product Quantization (PQ)。上边举的例子（float32 -> byte）就是标量量化。

更多细节，请见文章开头给的四篇文章，我就不一一赘述了。

Qdrant的向量压缩算法

qdrant有篇文章介绍它的向量压缩算法，详细可见：

https://qdrant.tech/documentation/guides/quantization/