- 皮尔逊相关系数 (Pearson Correlation Coefficient): 相关度
1.1 衡量两个值线性相关强度的量
1.2 r取值范围 [-1, 1]:
正向相关: r>0, 负向相关:r<0, 无相关性:r=0
1.3 相关度计算:
其中,Var是方差,展开计算就如下图所示:r=
进行相关度计算
3 . 其他例子:
R平方值
4.1定义:决定系数,反应因变量的全部变异能通过回归关系被自变量解释的比例。
4.2 描述:如R平方为0.8,则表示回归关系可以解释因变量80%的变异。换句话说,如果我们能控制自变量不变,则因变量的变异程度会减少80%,值越大就表示拟合度越高。
简单线性回归:
R^2 = r * r
多元线性回归:
SSR+SSE=SST
5. R平方也有其局限性:R平方随着自变量的增加会变大,R平方和样本量是有关系的。因此,我们要到R平方进行修正。修正的方法:
在python实现计算相关度和决定系数:
相关度计算;
R^2(决定系数)计算:
函数polyfit(x,y,degree)的功能是根据x,y,degree一次性求出回归方程包括所有系数,degree是x的最高次方数
poly1d输出预测值