相似度搜索根据特定的相似度度量为给定查询对象查找相似的对象。由于度量空间可以容纳任何类型的数据并支持灵活的距离度量,因此在度量空间中的相似度搜索越来越受到关注。但是,度量空间只对具有特定相似性度量的单个数据类型建模。相反,多度量空间结合多个度量空间来同时建模各种数据类型和一组相关的相似性度量。因此,一个多度量空间能够对任意度量空间组合进行相似度搜索。许多研究集中在单个度量空间的索引,而针对多度量空间的索引以加速相似度搜索的研究则很少。在本文中,我们提出了一种高效的基于动态聚类的多度量空间相似度搜索森林指数DESIRE。DESIRE首先选择高质量的中心将对象聚集成紧凑的区域,然后利用B+-树有效地索引中心与对应对象之间的距离。为了支持动态场景,开发了高效的更新策略。此外,我们提供过滤技术来加速多度量空间中的相似度查询。在四个真实数据集上的大量实验表明,与最先进的多度量空间索引相比,我们提出的DESIRE具有更高的效率和可扩展性。
背景:多维度量空间结合多个度量空间来同时建模由不同类型数据表示的对象的不同特征,并支持一系列相关的相似性度量。它能够在任何度量空间的组合中执行相似性搜索。因此,多重度量索引提供了一种降低这种复杂性的方法,有利于矢量数据库的发展。
Challenge I: How to effectively index multi-metric space?
Challenge II: How to efficiently perform similarity search in multimetric spaces?
Challenge III: How