前言:⼀般情况来说,单⼀评分标准无法完全评估⼀个机器学习模型。只用good和bad偏离真实场景去评估某个模型,都是一种欠妥的评估方式。
分类模型常用的评估方法
回归模型常用的评估方法
精准解释什么是误差、偏差、方差
误差(error):学习器的实际预测输出与样本的真实输出之间的差异称为“误差”。
偏差(Bias):衡量模型拟合训练数据的能⼒,Bias反映的是模型在样本上的输出与真实值之间的误差,即模型本⾝的精准度。
方差(Variance):反映的是模型每⼀次输出结果与模型输出期望之间的误差,即模型的稳定性。
- Error = Bias + Variance + Noise,Error反映的是整个模型的准确度
经验误差和泛化误差
经验误差(empirical error):也叫训练误差(training error),模型在训练集上的误差。
泛化误差(generalization error):模型在新样本集(测试集)上的误差称为“泛化误差”。
图解欠拟合、过拟合
- 欠拟合的模型具有高偏差,过拟合的模型具有高方差。
- 横轴为训练样本数量,纵轴为误差:
- 横轴为模型复杂程度,纵轴为误差:
- 横轴为正则项系数,纵轴为误差: