Machine Learning A-Z学习笔记5
第五章 回归模型的评估与选择
1.R平方与广义R平方
- 剩余平方和(residual sum of squar):拟合线诠释数据特征,越小越好,负数代表模型错误。
- 共平方和(total sum of square):数据波动情况。
-
R平方(R-squared):拟合线诠释数据特征,越接近1代表模型越好。
-
R平方最多等于1,也就是剩余平方和等于0,這是理想。
-
R平方如果為负值,也就代表剩余平方和过大,模型错误
-
R平方无法客观评价加入新的特征是否有益于模型,就算添加一个毫无关系的特征,R平方最多也是保持不变
A
- 广义R平方也叫修正R平方(adjusted R-squared),相较于R平方,修正R平方会考虑自变量的影响。增加自自变量会同时拉高R方和(n-1)/(n-p-1),但如果模型提升幅度大于自变量数量,则(1-R^2)会拉低(n-1)/(n-p-1) ,最终造成修正R平方趋向于1,则变量有效;如果造成修正R平方趋向0,则变量无效。
\