高维向量相似搜索插件 pgvector

大模型爆火以后,持仓股票都卖飞了(捶自己),只能研究研究技术,来填补下心灵上的创伤。

正在用openai开放的接口做调试,用embedding接口来实现内容相似度检索,并用chatGPT生成答案,从目前来看实现的效果还不错。

embedding接口会返回一组vector,相对于其他数据的向量搜索,它生成的向量精确度更高,起初用的是supebase云数据库,后来替换成了postgres(支持私有化部署PostgreSQL: The world's most advanced open source database),向量存储都用到了pgvector(GitHub - pgvector/pgvector: Open-source vector similarity search for Postgres

讲下pgvector,PostgreSQL 内置的cube插件支持最高100维向量, 每个维度8字节, 性能一般。阿里云rds pg提供了一个高维向量插件pase用于解决高精度向量高效搜索, 例如人脸识别。同时pase有对外公开发表的论文, 基于这个论文, 国外的开源爱好者开发了一个名为pgvector的插件, 支持ivfflat索引算法。

vector支持三种向量距离

  • 2
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值