相似度计算
@author:wepon
@blog:http://blog.csdn.net/u012162613/article/details/42213883
《Machine Learning in Action》笔记,相似度计算,基于python+numpy。
在推荐系统中,我们需要计算两个物品的相似度,对于物品的描述,一般都可以量化为一个向量,于是两个物品之间的相似度就可以用两个向量的相关性来描述,这是概率论的范畴了。
假如我们希望相似度的值在0~1之间,并且越相似,值越大,有哪些办法?
1、计算欧式距离,然后根据“相似度=1/(1+距离)”计算相似度。
2、皮尔逊相关系数,在numpy中可以用线性代数模块linalg中的corrcoef()来计算相关系数(correlation coefficient)。得出结果的取值范围是-1