一 . p范数
向量的长度,也叫向量的范数,p范数定义了距离,kmeans 长度的扩展:(a**p+b**p+c**p)**(1/p)
二. 向量a和向量b的内积(点积)
a·b = a1*b1+a2*b2+a3*b3=|a|*|b|cosq
物理意义:点积反映了2个向量共振的程度
三. 向量的投影
Proj.u = (u·v)/|v|
物理意义:向量u在向量v上的投影
四.cos相似度的计算公式:cosq = (u·v) / (|u|*|v|)
cosq的值越大,表明相似度越大。
两个向量的cos相似度越大,两个向量就越相似
cos相似度的问题:当用户的评分尺度不一样时,就无法正确反映有用的信息,这就想到Pearson相似度
五. Pearson相似度
又叫Pearson相关系数,correlation coefficient