对于测试样本
x
\bm{x}
x,令
y
D
y_{D}
yD为
x
\bm{x}
x在数据集中的真实标记,
f
(
x
;
D
)
f(\bm{x};D)
f(x;D)为训练集
D
D
D上
学得模型
f
f
f在
x
\bm{x}
x上的预测输出。以回归问题为例,学习算法的期望预测为:
f
‾
(
x
)
=
E
D
[
f
(
x
;
D
)
]
\overline{f}(x)=E_{D}[f(\bm{x};D)]
f(x)=ED[f(x;D)]
使用样本数相同的不同的训练集产生的方差为:
v
a
r
(
x
)
=
E
D
[
(
f
(
x
;
D
)
−
f
‾
(
x
)
)
2
]
var(\bm{x})=E_{D}[(f(\bm{x};D)-\overline{f}(x))^2]
var(x)=ED[(f(x;D)−f(x))2]
噪声为:
ε
2
=
E
D
[
(
y
D
−
y
)
2
]
\varepsilon^2=E_{D}[(y_D-y)^2]
ε2=ED[(yD−y)2]
期望输出与真实标记的差别称为偏差:
b
i
a
s
2
(
x
)
=
(
f
‾
(
x
)
−
y
)
2
bias^2(\bm{x})=(\overline{f}(x)-y)^2
bias2(x)=(f(x)−y)2
假定噪声的期望为0,即
E
D
[
y
D
−
y
]
=
0
E_D[y_D-y]=0
ED[yD−y]=0,下面对算法的期望泛化误差进行分解:
E
(
f
;
D
)
=
E
D
[
(
f
(
x
;
D
)
−
y
D
)
2
]
E(f;D) = E_D[(f(\bm{x};D)-y_D)^2]
E(f;D)=ED[(f(x;D)−yD)2]
=
E
D
[
(
f
(
x
;
D
)
−
f
‾
(
x
)
+
f
‾
(
x
)
−
y
D
)
2
]
=E_D[(f(x;D)-\overline{f}(x)+\overline{f}(x)-y_D)^2]
=ED[(f(x;D)−f(x)+f(x)−yD)2]
=
E
D
[
(
f
(
x
;
D
)
−
f
‾
(
x
)
)
2
]
+
E
D
[
(
f
‾
(
x
)
−
y
D
)
2
]
+
E
D
[
2
(
f
(
x
;
D
)
−
f
‾
(
x
)
)
(
f
‾
(
x
)
−
y
D
)
]
=E_D[(f(x;D)-\overline{f}(x))^2]+E_D[(\overline{f}(x)-y_D)^2]+E_D[2(f(x;D)-\overline{f}(x))(\overline{f}(x)-y_D)]
=ED[(f(x;D)−f(x))2]+ED[(f(x)−yD)2]+ED[2(f(x;D)−f(x))(f(x)−yD)]
=
E
D
[
(
f
(
x
;
D
)
−
f
‾
(
x
)
)
2
]
+
E
D
[
(
f
‾
(
x
)
−
y
+
y
−
y
D
)
2
]
=E_D[(f(x;D)-\overline{f}(x))^2]+E_D[(\overline{f}(x)-y+y-y_D)^2]
=ED[(f(x;D)−f(x))2]+ED[(f(x)−y+y−yD)2]
=
E
D
[
(
f
(
x
;
D
)
−
f
‾
(
x
)
)
2
]
+
E
D
[
(
f
‾
(
x
)
−
y
)
2
]
+
E
D
[
(
y
−
y
D
)
2
]
+
2
E
D
[
(
f
‾
(
x
)
−
y
)
(
y
−
y
D
)
]
=E_D[(f(x;D)-\overline{f}(x))^2]+E_D[(\overline{f}(x)-y)^2]+E_D[(y-y_D)^2]+2E_D[(\overline{f}(x)-y)(y-y_D)]
=ED[(f(x;D)−f(x))2]+ED[(f(x)−y)2]+ED[(y−yD)2]+2ED[(f(x)−y)(y−yD)]
=
E
D
[
(
f
(
x
;
D
)
−
f
‾
(
x
)
)
2
]
+
(
f
‾
(
x
)
−
y
)
2
+
E
D
[
(
y
D
−
y
)
2
]
=E_D[(f(x;D)-\overline{f}(x))^2]+(\overline{f}(x)-y)^2+E_D[(y_D-y)^2]
=ED[(f(x;D)−f(x))2]+(f(x)−y)2+ED[(yD−y)2]
=
b
i
a
s
2
(
x
)
+
v
a
r
(
x
)
+
ε
2
=bias^2(x)+var(x)+\varepsilon^2
=bias2(x)+var(x)+ε2
偏差:学习算法的期望预测与真实结果的偏离程度
方差:数据扰动所造成的影响
噪声:表达了当前任务上任何学习算法所能达到的期望泛化误差的下界
参考:西瓜书