决定系数
决定系数反应了y的波动有多少百分比能被x的波动所描述,即表征依变数Y的变异中有多少百分比,可由控制的自变数X来解释.
表达式:R2=SSR/SST=1-SSE/SST
其中:SST=SSR+SSE,SST(total sum of squares)为总平方和,SSR(regression sum of squares)为回归平方和,SSE(error sum of squares) 为残差平方和。
回归平方和:SSR(Sum of Squares forregression) = ESS (explained sum of squares)
残差平方和:SSE(Sum of Squares for Error) = RSS(residual sum of squares)
总离差平方和:SST(Sum of Squares fortotal) = TSS(total sum of squares)
SSE+SSR=SST RSS+ESS=TSS
意义:决定系数越大,自变量对因变量的解释程度越高,自变量引起的变动占总变动的百分比高。
相关系数
皮尔逊相关系数(Pearson Correlation Coefficient)
1)衡量两个值线性相关强度的量;
2)取值范围:[-1,1]
正向相关:>0,负向相关:<0,无相关性:=0
3)定义
决定系数与相关系数的关系
在一元线性相关情况下,决定系数是相关系数的平方。 相关系数是用来描述两个变量之间的线性关系的,但决定系数的适用范围更广,可以用于描述非线性或者有两个及两个以上自变量的相关关系。
决定系数的意义是变量A可以解释变量B方差的多少。因此,相关系数的意义(为正的情况)就是变量A可以解释变量B标准差的多少。
更直接的解释是,由于变量A的变动,变量B增加了C,而这C中有r的比例是因为变量A的变动造成的。