皮尔逊相关系数计算过程备忘。
首先记录下3个公式:
1、皮尔逊相关系数公式: | |
2、协方差公式: | |
3、标准差公式: | s=sqrt(((x1-x)^2 +(x2-x)^2 +......(xn-x)^2)/n)。x为x1~xn的均值(也叫做期望值E[X]) |
本例中使用维基百科中的例子:例如,有5个国家的国民生产总值分别为 10、20、30、50 、80 亿美元。 假设这5个国家 (顺序相同) 的贫困百分比分别为 11%、12%、13%、15%、18%(使用0.11、0.12、0.13、0.15、0.18) 。皮尔逊相关系数计算过程如下:
1、先计算分子XY变量的协方差,我使用E[XY]-E[X]E[Y]公式进行计算:
10*0.11= | 1.1 |
20*0.12= | 2.4 |
30*0.13= | 3.9 |
50*0.15= | 7.5 |
80*0.18= | 14.4 |
E[XY]= | (1.1 + 2.4 + 3.9 + 7.5 + 14.4) / 5 = 5.86 |
E[X]=(10+20+30+50+80)/5=38
E[Y]=(0.11+0.12+0.13+0.15+0.18)/5=0.138
计算得出协方差cov(X,Y)结果为5.86-38*0.138=0.616
2、然后计算分母X和Y的标准差
上面已经得出X和Y的均值(期望值E[X],E[Y])分别为38和0.138。
计算X标准差:
(10-38)^2= | 784 |
(20-38)^2= | 324 |
(30-38)^2= | 64 |
(50-38)^2= | 144 |
(80-38)^2= | 1764 |
σX | sqrt((784 + 324 + 64 + 144 + 1764) / 5) = 24.81935... |
计算Y标准差:
(0.11-0.138)^2= | 0.000784 |
(0.12-0.138)^2= | 0.000324 |
(0.13-0.138)^2= | 0.000064 |
(0.15-0.138)^2= | 0.000144 |
(0.18-0.138)^2= | 0.001764 |
σY | sqrt((0.000784 + 0.000324 + 0.000064 + 0.000144 + 0.001764) / 5) = 0.024819... |
计算得出σXσY结果为24.81935...*0.024819...=0.616
3、最终得到皮尔逊相关系数0.616/0.616=1,XY正相关