机器学习中关于回归模型有时候需要衡量自变量和因变量之间的相关度,接下来介绍两个衡量相关度的指标:
皮尔逊相关系数
它是用来衡量两个变量之间的相关度的;
取值:[-1,1]
该值>0 表示两个变量之间是正相关的,值为0表示两个变量之间无相关性,值<0表示两个变量之间是负相关的;
皮尔逊相关系数的计算公式可以表示为:
R平方值
也称为决定系数,反映因变量的全部变异能通过回归关系被自变量解释的比例
该值越高说明模型越好
比如 R平方值为0.8,表示在所有因变量(也就是y)的变化中,其中80%可以由该回归模型解释,也就是该回归模型可以解释因变量80%的变异,也就是说,如果我们控制自变量不变,那么因变量的变化程度可以减少80%
对于简单线性回归,R平方就是上面皮尔逊相关系数r的平方值
对于多元线性回归: