用通俗易懂的方式讲解:大模型向量数据库那么多,我该如何选择?

在一个语义搜索和检索增强生成(RAG)正在重新定义的时代,支持这些进步的支柱往往被忽视:向量数据库。如果您涉足大型语言模型、RAG或任何利用语义搜索的平台,那么你来对地方了。

对于那些在这一领域探索的人,筛选并比较领先的向量数据库是必要的。选择一个向量数据库可能很困难,需要考虑可伸缩性、延迟、成本甚至合规性。

我在比较中包含了以下向量数据库:Pinecone、Weviate、Milvus、Qdrant、Chroma、Elasticsearch和PGvector。比较背后的数据来自ANN基准测试、每个向量数据库的文档和内部基准测试,以及深入挖掘的开源GitHub存储库中的信息。

PineconeWeaviateMilvusQdrantChromaElasticsearchPGvector
是否开源
自助托管
云管理✔️
用于向量构建
开发者体验👍👍👍👍👍👍👍👍👍👍👍👍👍
社区社区页面和活动8k☆ GitHub,4k Slack23k☆ GitHub,4k Slack13k☆ GitHub,3k Discord9k☆ GitHub,6k Discord23k Slack6k☆ GitHub
每秒查询次数(使用nytimes-256-angular文本)150 *适用于p2,但可以添加更多Pod7912406326?700-100 *来自各种报告141
延迟,毫秒(召回/百分位95(毫秒),nytimes-256-angular)1 *批量搜索,0.99召回,200k SBERT214??8
支持的索引类型?HNSW多个(总共11个)HNSWHNSWHNSWHNSW/IVFFlat
混合搜索(即标量过滤)
磁盘索引支持
基于角色的访问控制
动态段位置与静态数据分片?静态分片动态段位置静态分片动态段位置静态分片-
免费托管层(免费自托管)(免费自托管)(免费自托管)(各不相同)
定价(50k向量@1536)$70从$25开始从$65开始估计$9各不相同$95各不相同
定价(20M向量,20M请求@768)$227(高性能为$2074)$1536从$309开始(高性能为$2291)从$281开始(高性能为$820)各不相同估计$1225各不相同

总结

在向量数据库领域中,不同的需求有着多样的选择。比较表清晰地呈现了情况,但以下是一个简明扼要的总结,以帮助您做出决定:

  • 开源和托管云:如果您倾向于开源解决方案,Weviate、Milvus和Chroma是顶尖的竞争者。尽管不是开源的,但 Pinecone 凭借其开发者体验和强大的完全托管解决方案脱颖而出。

  • 性能:就每秒查询量而言,Milvus领先,紧随其后的是Weviate和Qdrant。然而,在延迟方面,Pinecone和Milvus都提供了令人印象深刻的低于2毫秒的结果。如果为Pinecone添加了多个Pod,那么可以达到更高的QPS。

  • 社区实力:Milvus拥有最大的社区存在,其次是Weviate和Elasticsearch。强大的社区往往意味着更好的支持、增强和错误修复。

  • 可扩展性、高级功能和安全性:对于许多企业应用程序至关重要的功能,如基于角色的访问控制,在Pinecone、Milvus和Elasticsearch中都有。在扩展方面,Milvus和Chroma提供了动态段放置功能,使它们适用于不断发展的数据集。如果您需要支持多种索引类型的数据库,Milvus支持11种不同类型的索引,这是无与伦比的。虽然混合搜索在各个数据库中都得到了很好的支持,但在磁盘索引支持方面,Elasticsearch确实有所不足。

  • 定价:对于初创企业或预算有限的项目来说,Qdrant为50k向量提供的估价约为9美元,是无法匹敌的。另一方面,对于需要高性能的大型项目来说,Pinecone和Milvus提供了具有竞争力的定价层次。

总之,对于向量数据库来说,并不存在一种适合所有情况的解决方案。理想的选择取决于具体的项目需求、预算限制和个人偏好。本指南提供了一个综合的视角,希望能简化开发者的决策过程。我的选择?我正在野外测试Pinecone和Milvus,主要是因为它们的高性能、Milvus强大的社区和灵活的价格。

技术交流

技术要学会分享、交流,不建议闭门造车。一个人走的很快、一堆人可以走的更远。

建立了大模型技术交流群, 大模型学习资料、数据代码、技术交流提升, 均可加知识星球交流群获取,群友已超过2000人,添加时切记的备注方式为:来源+兴趣方向,方便找到志同道合的朋友。

方式①、微信搜索公众号:机器学习社区,后台回复:技术交流
方式②、添加微信号:mlc2060,备注:技术交流

用通俗易懂的方式讲解系列

  • 25
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值