【部分源于 刘顺祥.《从零开始学Python数据分析与挖掘》.清华大学出版社】
1.偏差与方差的区别 用实例区分
红心为实际值,蓝环为预测值
- 低偏差,低方差:理想模型
- 低偏差,高方差:过拟合了。模型太贴合训练数据了,其泛化(或通用)能力差,若遇到测试集,则准确度下降的厉害;
- 高偏差,低方差:常为训练的初始阶段;
- 高偏差,高方差:准确度差,数据的离散程度也差。
2. 偏差、方差与误差的关系
误差=偏差+方差
Error(误差)反映的是整个模型的准确度
4.岭回归与lasso回归的异同点
相对于岭回归而言,LASSO回归剔除了两个变量,降低了模型的复杂度,同时减少了均方误差,提高了模型的拟合效果。