距离计算公式
Milvus 基于不同的距离计算方式比较向量间的距离。根据插入数据的形式,选择合适的距离计算方式能极大地提高数据分类和聚类性能。
浮点型向量主要使用以下距离计算公式:
欧氏距离 (L2):主要运用于计算机视觉领域。
内积 (IP): 主要运用于自然语言处理(NLP)领域。
二值型向量主要使用以下距离计算公式:
汉明距离 (Hamming):主要运用于自然语言处理(NLP)领域。
杰卡德距离 (Jaccard):主要运用于化学分子式检索领域。
谷本距离 (Tanimoto):主要运用于化学分子式检索领域。
超结构 (Superstructure):主要运用于检索化学分子式的相似超结构。
子结构 (Substructure):主要运用于检索化学分子式的相似子结构。