向量数据库

向量数据库可以做哪些事情

  • 存储和索引向量
  • 检索相似向量,还具有过滤功能
  • 自动将文档转变成向量,所以会自动化分词、向量化、索引等操作

目前存在的向量数据库:

名称github开源协议
chromahttps://github.com/chroma-core/chromaApache 2.0
Milvushttps://github.com/milvus-io/milvusApache 2.0
Pinecone未开源/
weaviatehttps://github.com/weaviate/weaviateBSD-3-Clause license
qdranthttps://github.com/qdrant/qdrantApache 2.0
vespahttps://github.com/vespa-engine/vespaApache 2.0
zilliz基于Milvus的商业版向量数据库/

其他跟向量数据库相关,严格来说不算向量数据库

  • Faiss 是一个提供高维向量相似性搜索和聚类的算法库,不算向量数据库,向量数据库的相似性检索可以使用到Faiss中的算法。
  • ScaNN 是google开源的相似向量搜索方法
  • vald 是一个可扩展的向量搜索引擎
  • pgvector 为Postgres 提供向量相似度搜索的库
  • typesense 可替代ElasticSearch, 也有向量搜索功能

对于文本,如何挑选向量类型,可参考比较基准:MTEB: Massive Text Embedding Benchmark


参考资料

  1. https://towardsdatascience.com/milvus-pinecone-vespa-weaviate-vald-gsi-what-unites-these-buzz-words-and-what-makes-each-9c65a3bd0696
  2. https://byby.dev/vector-databases
  3. https://platform.openai.com/docs/guides/embeddings/what-are-embeddings
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值