大模型的数据供血系统-向量数据库常识科普

本文科普了向量数据库在AI行业的新兴趋势,包括其在大模型中的作用,以及如何理解向量数据。文章指出,向量数据库成为数据库技术的新方向,腾讯云等公司已推出相关产品。向量数据库作为大模型的‘供血系统’,用于存储和检索模型训练后的向量数据,支持高并发读写和多种向量计算方法。在选型和预估时,需要考虑数据量级、并发性能、索引类型和计算需求。推荐腾讯云的向量数据库,因其具备内部长期使用背景、大规模支撑能力和集成解决方案。
摘要由CSDN通过智能技术生成

1. 数据库行业有了新动向

对于传统数据库研发运维来说,数据库行业上次有概念创新,还是十几年前的NoSQL……

在AI大行业发展的推进下,向量数据库成为了最新兴的数据库技术趋势,业内多家开源向量数据库都拿到了高额融资,腾讯云等多家云厂商,也在将自用的向量数据库包装云化推广给客户。

附录:这个行业的大新闻时间轴

  • 去年8月,Zilliz(Milvus)B轮融资 $103M

  • 今年3月,NVIDIA和OpenAI 同时强调向量数据库的重要性。

  • 今年4月,Chroma: 种子轮融资 $18M

  • 今年4月,Qdrant: 种子轮融资 $7.5M

  • 今年4月,Weaviate: B轮融资 $50M

  • 今年4月,Pinecone: B轮融资 $100M

大部分研发和运维工程师从未接触过向量数据,也更未了解过向量数据库;但是各种大模型和生成式AI技术,都会用到向量数据库。笔者趁着腾讯云发布向量数据库产品的机会,向相关领域技术大牛进行了多次讨教学习,给不了解向量数据库的读者们做一次公益科普。

8f6099a7877d851e0d2b03cb9acd83c6.jpeg


2. 什么是向量数据

科普的开篇,读者首先弄清楚一个问题,什么是向量数据,向量数据和大模型有什么关系。

“向量-Vector”虽然高中课本就学过,但是计算机领域、大模型领域使用的向量还是和数学向量有点区别。所以本文先举3个向量数据的例子,再举1个向量计算的例子。

举例1:简单向量数据。这个例子就是各种一维数组,类似于各种xy轴、xyz轴的数组。

a=[0.5, 0.3]   b=[0.33, -0.59

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值