计算测定系数R²
拟合优度是指回归直线对观测值的拟合程度。度量拟合优度的统计量是测定系数(R²)。
要算R²,我们要先了解SSE、SSR、SST
- 残差平方和(RSS)= SSE(误差平方和):实际值与预测值之间差的平方之和。
- 可解释的变异平方和(SSR):预测值与实际均值之间差的平方之和。
- 总平方和(SST):实际值与实际均值之间差的平方之和。
SST=SSE+SSR
R²就是指可解释的变异占总变异的百分比,R²越接近于1,模型的拟合优度越高。
R²=SSR/SST=(1-SSE/SST) 0≤R²≤1
- 当R²=1时,SSR=SST拟合点与原数据完全吻合
- 当R²=0时,SSE=SSTy的变异完全由与x无关的因素引起的
而R²又等于y与拟合变量(预测值)y‘的相关系数平方。
所以R²的优点:1)从数据变异角度支出可解释的变异占总变异的百分比,从而说明回归直线拟合的优良程度。2)从相关性角度说明变量y与拟合变量y’的相关程度。