估计子的bias和variance
上一讲阐述了较为重要的是测试集的误差,该误差来源包括了bias和variance,并且更加复杂的模型并不一定会带来更低的误差。
对于实际的情况,存在一个最佳的预测函数,记为 f^ f ^ ,此为理想情况;实际情况中,我们根据training data,可以得到一个预测函数,记为 f∗ f ∗ ,此时我们可以称 f∗ f ∗ 为 f^ f ^ 的一个估计子(estimator),此时可以引入bias和variance的概念,即统计里面的概念,例如无偏估计量(unbias estamator)、方差等等 。
对于一系列的数据,可以通过数据 {