查阅了各大科技博客,关于拟合优度的阐述多停留在应用层面
本文作者意图通过对拟合优度原理探究,加深对拟合优度的理解
本人为普通本科生
若有不当之处
敬请斧正
以一元线性拟合为例
Y=A+Bx+e,
式中e代表随机误差,呈标准正态分布
如上为Yi关于Yequal的variance
由两个因素产生
1:输入值Xi多样,导致输出值Yi多样
2:随机误差因素二
上式为将因素一纳入考虑范围余下的variance(即为因素二导致)
PS:用A+Bxi替代Yequal,消除了由于多样性输入带来的那一部分variance
故余式表达的即为因素一导致的variance
由于因素一产生的variance是对该数据集用线性回归方法进行拟合产生的必然结果,
该值占总variance的比例可以表现该拟合效果,
故定义其为拟合优度
当拟合优度接近于1的时候,表明大部分的variance可以由输入多样性解释
由此可得该线性回归模型fit
Reference: Introduction to Probility and statistics for Engineering and Scientists 5th edition (Sheldon M. Ross)