Milvus 基本概念

本文介绍了Milvus,一个专为处理深度学习和机器学习生成的向量数据的向量数据库。它通过Collection、Entity、Field和Segment等概念组织数据,支持分片、分区、归一化和索引,以提升数据存储、检索效率。
摘要由CSDN通过智能技术生成

知道特征向量是什么

向量又称为 embedding vector,是指由embedding技术从离散变量(如xxx等各种非结构化数据)转变而来的连续向量。在数学表示上,向量是一个由浮点数或者二值型数据组成的 n 维数组。通过现代的向量转化技术,比如各种人工智能(AI)或者机器学习(ML)模型,可以将非结构化数据抽象为 n 维特征向量空间的向量。这样就可以采用最近邻算法(ANN)计算非结构化数据之间的相似度。

Milvus 是向量数据库

主要用于存储、索引和管理通过深度神经网络和机器学习模型产生的海量向量数据。

Collection 等价 数据库的表

Collection 包含一组 entity。

Entity

实体包含一组 field

Field

field 与实际对象相对应。

Segment 段

Milvus 在数据插入时通过合并数据自动创建的数据文件。一个 collection 可以包含多个 segment。一个 segment 可以包含多个 entity。在搜索中,Milvus 会搜索每个 segment,并返回合并后的结果。

分片

将数据写入操作分散到不同节点上,使 Milvus 能充分利用集群的并行计算能力进行写入。默认情况下单个 collection 包含 2 个分片(shard)。目前 Milvus 采用基于主键哈希的分片方式,未来将支持随机分片、自定义分片等更加灵活的分片方式。

分区

把 collection 中的数据根据一定规则在物理存储上分成多个部分。这种对 collection 数据的划分就叫分区(partitioning)。每个 partition 可包含多个segment。

归一化

归一化指的是通过数学变换将向量的模长变为 1 的过程。如需使用点积计算向量相似度,则必须对向量作归一化处理。处理后点积与余弦相似度等价。

索引

索引基于原始数据构建,可以提高对 collection 数据搜索的速度。

向量

一种类型的 field,代表对象的特征。非结构化数据可以通过各种 AI 模型和 embedding 技术转化为向量。

Milvus是一个面向向量的存储引擎,主要用于存储、索引和管理通过深度神经网络和机器学习模型产生的海量向量数据。在Milvus中,数据被存储为向量,向量由embedding技术从离散变量(如图片、文本等)转变而来,是n维浮点数或者二值型数据组成的数组。Collection等价于数据库中的表,它包含了一组entity(实体),实体包含了一组field。Segment是在数据插入时通过合并数据自动创建的数据文件。一个Collection可以包含多个Segment,而一个Segment可以包含多个Entity。分片是将数据写入操作分散到不同节点上,使Milvus能够充分利用集群的并行计算能力进行写入。分区是根据一定规则将Collection中数据在物理存储上分成多个部分。归一化是将向量模长变为1的过程。索引是基于原始数据构建,可以提高数据搜索的速度。向量是一种类型的field,代表对象的特征,非结构化数据可以通过各种AI模型和embedding技术转化为向量。

  • 6
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Milvus 是一个开源的向量相似度搜索引擎,而Spring Boot 是一个用于构建基于 Java 的独立、生产级的应用程序的框架。 Milvus Spring Boot 是将 Milvus 与 Spring Boot 框架结合使用的一种方式。借助 Spring Boot,我们可以更方便地构建基于 Milvus 的应用程序。 首先,我们可以使用 Spring Boot 的依赖管理功能,将 Milvus 的 Java 客户端库添加到项目中。这样,我们就可以在我们的应用程序中直接使用 Milvus 的功能,如向量的插入、查询和删除等。 其次,Spring Boot 提供了强大的配置管理功能,我们可以轻松地将 Milvus 的连接配置信息添加到应用程序的配置文件中,例如指定 Milvus 的 IP 地址、端口号和连接池大小等。这样,我们就可以灵活地管理 Milvus 与其他组件的连接。 另外,Spring Boot 还提供了便捷的 RESTful API 开发功能。我们可以利用这一特性,将 Milvus 的搜索引擎功能以接口的形式暴露给客户端,使得客户端可以通过 HTTP 请求来进行向量的检索。这样,我们可以轻松地建立一个灵活、高性能的分布式向量搜索系统。 总的来说,Milvus Spring Boot 结合了 Milvus 的强大功能和 Spring Boot 的便捷开发特性,使得我们可以更快速、灵活地搭建起一个高性能的向量搜索应用程序。它在大数据人工智能等领域有广泛的应用前景,可以应对各种复杂的向量查询需求。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值