偏差、方差与噪声
偏差(Bias):描述的是根据样本拟合出的模型的输出预测结果的期望与样本真实结果的差距,即在样本上拟合的好不好。
方差(Variance):模型每次输出结果与模型输出期望之间的误差,即模型的稳定性。
噪声(Noise):为真实标记与数据集中的实际标记间的偏差,通常由多种因素综合影响造成,不可去除。
偏差度量了学习算法的期望预测与真实结果的偏离程度,刻画了学习算法本身的拟合能力。
方差度量了同样大小的训练集的变动所导致的学习性能的变化,即刻画了数据扰动所造成的影响。
噪声表达了在当前任务上任何学习算法所能达到的期望泛化误差的下界,即刻画了学习问题本身的难度。
泛化误差组成推导*
偏差与方差
偏差体现的是拟合程度优劣,通常模型越复杂,偏差越小,当偏差较大时,即预期输出和实际结果偏离较大,称之为欠拟合。
方差体现的是模型的稳定程度。通常模型越简单,方差越小。当方差较大时,模型不稳定,即对一些新数据的预测不稳定。偏差小,方差大的情况即为过拟合。
模拟:偏差和方差