Python 机器(算法)学习(一)
皮尔森相关系数(Pearson Correlation Coefficient)----又称积矩相关系数,是一种线性相关系数。反映两个变量线性相关程度的统计量。相关系数用r表示,n表示样本量。r表示两个变量间线性相关强弱程度。r越大相关性越强。
sum1 = sum([prefs[p1][it] for it in si]) sum2 = sum([prefs[p2][it] for it in si]) sum1Sq = sum([pow(prefs[p1][it],2) for it in si]) sum2Sq = sum([pow(prefs[p2][it], 2) for it in si]) pSum = sum([prefs[p1][it]*prefs[p2][it] for it in si]) num = pSum-(sum1*sum2/n) den = sqrt((sum1Sq-pow(sum1,2)/n)*(sum2Sq-pow(sum2,2)/n)) if den==0:return 22 r=num/den return r
简单的理解为 : 数据偏离中心点的距离.等于变量减掉平均数再除以标准差