######################
尊重版权,转载注明地址
######################
相似度算法介绍
相似度算法主要任务是衡量对象之间的相似程度,是信息检索、推荐系统、数据挖掘等的一个基础性计算。下面重点介绍几种比较常用的相似度算法。
向量表示
通常假设对象X和Y都具有N维的特征,即
X=(x_1,x_2,…x_n) Y=(y_1,y_2,…y_n)
在推荐场景下,假设用户物品矩阵为:
item1=(0,1,1) item2=(1,0,1)
1.欧氏距离
欧式距离相似度算法需要保证各个维度指标在相同的刻度级别,比如对身高、体重两个单位不同的指标使用欧氏距离可能使结果失效。