SSE
- Sum of Squared Errors, 和方差
- 拟合数据和原始数据对应点的误差的平方和
- SSE越接近于0,说明模型选择和拟合更好,数据预测也越成功
S S E = ∑ i = 1 n ( y i − y ^ i ) 2 SSE = \sum\limits_{i=1}^n (y_i - \hat y_i)^2 SSE=i=1∑n(yi−y^i)2
MSE
- Mean Square Error, 均方差
- 预测数据和原始数据对应点误差的平方和的均值
M S E = S S E n = ∑ i = 1 n ( y i − y ^ i ) 2 n MSE = \frac{SSE}{n} = \frac{\sum\limits_{i=1}^n (y_i - \hat y_i)^2}{n} MSE=nSSE=ni=1∑n(yi−y^i)2
RMSE
- Root Mean Square Error,均方根
- 与MAE对比:RMSE相当于L2范数,MAE相当于L1范数。次数越高,计算结果就越与较大的值有关,而忽略较小的值,所以这就是为什么RMSE针对异常值更敏感的原因(即有一个预测值与真实值相差很大,那么RMSE就会很大)
- 与标准差对比:标准差是用来衡量一组数自身的离散程度,而均方根误差是用来衡量观测值同真值之间的偏差,它们的研究对象和研究目的不同,但是计算过程类似。
R M S E = M S E = S S E n = ∑ i = 1 n ( y i − y ^ i ) 2 n RMSE = \sqrt{MSE} = \sqrt{\frac{SSE}{n}} = \sqrt{\frac{\sum\limits_{i=1}^n (y_i - \hat y_i)^2}{n}} RMSE=MSE=nSSE=ni=1∑n(yi−y^i)2
MAE
- Mean Absolute Error ,平均绝对误差
- 是绝对误差的平均值
- 能更好地反映预测值误差的实际情况.
M A E = ∑ i = 1 n ∣ y i − y ^ i ∣ n MAE = \frac{\sum\limits_{i=1}^n \vert y_i - \hat y_i\vert}{n} MAE=ni=1∑n∣yi−y^i∣
FCP
- Fraction of Concordant Pairs, 一致序列对比率评分
- 计算评分一致的物品对在所有物品对中的占比。
n c u = ∣ { ( i , j ) ∣ ( r ^ u , i > r ^ u , j & r u , i > r u , j ) o r ( r ^ u , i = = r ^ u , j & r u , i = = r u , j ) } ∣ n d u = ∣ { ( i , j ) ∣ ( r ^ u , i − r ^ u , j ) ( r u , i − r u , j ) ≤ 0 & i > j } ∣ n c = ∑ u n c u n d = ∑ u n d u F C P = n c n c + n d n_c^u = \lvert \{{(i, j)} \vert (\hat r_{u,i} > \hat r_{u,j}\ \&\ r_{u,i} > r_{u,j}) or (\hat r_{u,i} == \hat r_{u,j}\ \&\ r_{u,i} == r_{u,j}) \}\rvert \\ n_d^u = \lvert \{{(i, j)} \vert (\hat r_{u,i} - \hat r_{u,j}) (r_{u,i} - r_{u,j}) \le 0\ \&\ i > j\} \rvert \\ n_c = \sum\limits_u n_c^u \\ n_d = \sum\limits_u n_d^u \\ FCP = \frac{n_c}{n_c + n_d} ncu=∣{(i,j)∣(r^u,i>r^u,j & ru,i>ru,j)or(r^u,i==r^u,j & ru,i==ru,j)}∣ndu=∣{(i,j)∣(r^u,i−r^u,j)(ru,i−ru,j)≤0 & i>j}∣nc=u∑ncund=u∑nduFCP=nc+ndnc
SD
- Standard Deviation ,标准差
- 是方差的算数平方根
- 是用来衡量一组数自身的离散程度
S D = ∑ i = 1 n ( x i − x ˉ ) 2 n SD = \sqrt{\frac{\sum\limits_{i=1}^n (x_i - \bar x)^2}{n}} SD=ni=1∑n(xi−xˉ)2
R-square(确定系数)
SSR
- Sum of squares of the regression
- 预测数据与原始数据均值之差的平方和
S S R = ∑ i = 1 n ( y ^ i − y ˉ ) 2 SSR = \sum\limits_{i=1}^n (\hat y_i - \bar y)^2 SSR=i=1∑n(y^i−yˉ)2
SST
- Total sum of squares
- 原始数据和均值之差的平方和
S S T = ∑ i = 1 n ( y i − y ˉ ) 2 SST = \sum\limits_{i=1}^n (y_i - \bar y)^2 SST=i=1∑n(yi−yˉ)2
即
S S T = S S E + S S R SST = SSE + SSR SST=SSE+SSR
R-square
- 取值范围为[0 1],越接近1,表明方程的变量对y的解释能力越强,这个模型对数据拟合的也较好
R − s q u a r e = S S R S S T = S S T − S S E S S T = 1 − S S E S S T R \hspace{-1.3mm} - \hspace{-1.3mm} square = \frac{SSR}{SST} = \frac{SST-SSE}{SST} = 1-\frac{SSE}{SST} R−square=SSTSSR=SSTSST−SSE=1−SSTSSE