评价线性回归方程拟合的情况,一般有两个参数,一个是 R 2 R^2 R2,另一个是皮尔森相关系数(Pearson Correlation Coefficient)。说到皮尔森,就不得不想起来斯皮尔曼相关系数(Spearman Correlation Coefficient),因此今天学习这三个点。
1. 决定系数 R 2 R^2 R2
R 2 R^2 R2衡量的是回归方程整体的拟合度,表达因变量与所有自变量之间的总体关系。 R 2 R^2 R2的计算公式如下:
(1) R 2 = 1 − ∑ i = 1 n ( y i − y i ^ ) 2 ∑ i = 1 n ( y i − y ˉ ) 2 R^2 = 1 - \frac{\sum_{i=1}^{n}(y_i-\hat{y_i})^2}{\sum_{i=1}^{n}(y_i-\bar{y})^2} \tag 1 R2=1−∑i=1n(yi−yˉ)2∑i=1n(yi−yi^)2(1)
公式中 y i y_i yi:表示实际观测到的值;
y i ^ \hat{y_i} yi^:表示回归方程预测到的值;
y ˉ \bar{y} yˉ:表示实际观测到的值的平均值
由公式(1),可以看出:
S S E = ∑ i = 1 n ( y i − y i ^ ) 2 SSE = \sum_{i=1}^{n}(y_i-\hat{y_i})^2 SSE=∑i=1n(yi−yi^)2是预测值和观测值距离的平方和(残差平方和:error sum of squares);极端情况下,回归方程预测100%正确,这个数值是0,那么 R 2 = 1 R^2=1 R2=1。
S S T = ∑ i = 1 n ( y i − y ˉ ) 2 SST = \sum_{i=1}^{n}(y_i-\bar{y})^2 SST=∑i=1