如何定位Milvus性能瓶颈并优化

Zilliz Planet

于 2024-07-19 16:55:27 发布

阅读量1.4k

点赞数 8

文章标签： milvus 数据库程序人生向量数据库云原生算法

本文链接：https://blog.csdn.net/weixin_44839084/article/details/140553171

版权

假设您拥有一台强大的计算机系统或一个应用，用于快速执行各种任务。但是，系统中有一个组件的速度跟不上其他部分，这个性能不佳的组件拉低了系统的整体性能，成为了整个系统的瓶颈。在软件领域中，瓶颈是指整个路径中吞吐量最低的部分。如果机器中的某个齿轮转得不够快，整个系统的速度都会受到影响。因此，及时识别和解决瓶颈问题的重要性不言而喻，能显著提升计算机系统和应用的效率。

在此前的文章中，我们已经介绍了评估各种向量数据库时使用的关键指标和性能测试工具。本文将以 Milvus 向量数据库为例，特别关注 Milvus 2.2 或以上版本，讲解如何监控搜索性能、识别瓶颈并优化向量数据库性能。

性能评估及监控指标

在向量数据库系统中，最常用且最重要的评估指标包括召回率（Recall）、延迟（Latency）和每秒查询数（QPS）。这些指标反映了系统的准确性、响应速度以及能够处理的请求量。

Recall

召回率是指在搜索查询中成功检索到的相关内容的比例。但是，通常并不是所有接近的向量都能被准确识别。这一不足往往源于索引算法的近似性（除了暴搜以外）。这些算法牺牲召回率以换取速度的提升。这些索引算法的配置旨在为特定生产需求寻找一个合适的平衡。更多详细信息，请参阅milvus的文档页面：内存索引和磁盘索引。

计算召回率可能会消耗大量资源，通常由客户端完成。由于确立 Ground truth 需要大量计算，因此通常不会显示在监控仪表板上。在接下来的指南中，我们假定已经达到了一个可接受的召回率水平，且已经为向量索引选定了适当的索引参数。