偏差-方差分解_和方差分解-CSDN博客

本文链接：https://blog.csdn.net/To_be_to_thought/article/details/88714900

对于测试样本 $\bm{x}$ ，令 $y_{D}$ 为 $\bm{x}$ 在数据集中的真实标记， $f(\bm{x};D)$ 为训练集 $D$ 上
学得模型 $f$ 在 $\bm{x}$ 上的预测输出。以回归问题为例，学习算法的期望预测为：
$\overline{f}(x)=E_{D}[f(\bm{x};D)]$
使用样本数相同的不同的训练集产生的方差为：
$var(\bm{x})=E_{D}[(f(\bm{x};D)-\overline{f}(x))^2]$
噪声为：
$\varepsilon^2=E_{D}[(y_D-y)^2]$
期望输出与真实标记的差别称为偏差：
$bias^2(\bm{x})=(\overline{f}(x)-y)^2$
假定噪声的期望为0，即 $E_D[y_D-y]=0$ ,下面对算法的期望泛化误差进行分解：
$E_D[(f(\bm{x};D)-y_D)^2]$
$=E_D[(f(x;D)-\overline{f}(x)+\overline{f}(x)-y_D)^2]$
$=E_D[(f(x;D)-\overline{f}(x))^2]+E_D[(\overline{f}(x)-y_D)^2]+E_D[2(f(x;D)-\overline{f}(x))(\overline{f}(x)-y_D)]$
$=E_D[(f(x;D)-\overline{f}(x))^2]+E_D[(\overline{f}(x)-y+y-y_D)^2]$
$=E_D[(f(x;D)-\overline{f}(x))^2]+E_D[(\overline{f}(x)-y)^2]+E_D[(y-y_D)^2]+2E_D[(\overline{f}(x)-y)(y-y_D)]$
$=E_D[(f(x;D)-\overline{f}(x))^2]+(\overline{f}(x)-y)^2+E_D[(y_D-y)^2]$
$=bias^2(x)+var(x)+\varepsilon^2$