南瓜书公式详解--------第一章绪论
式(1.1)
E
o
t
e
(
L
a
∣
X
,
f
)
=
∑
h
∑
x
∈
X
−
X
P
(
x
)
I
(
h
(
x
)
≠
f
(
x
)
)
P
(
h
∣
X
,
L
a
)
E_{o t e}\left(\mathfrak{L}_{a} | X, f\right)=\sum_{h} \sum_{\boldsymbol{x} \in \mathcal{X}-X} P(\boldsymbol{x}) \mathbb{I}(h(\boldsymbol{x}) \neq f(\boldsymbol{x})) P\left(h | X, \mathfrak{L}_{a}\right)
Eote(La∣X,f)=h∑x∈X−X∑P(x)I(h(x)=f(x))P(h∣X,La)
公式是关于一个特定的数学期望
E
o
t
e
E_{ote}
Eote 的表达式,通常称为“离线期望”(Out-of-Time Expectation),在机器学习中,特别是在评估模型的泛化能力时使用。这个公式可能在讨论集成学习、强化学习或其他需要评估模型在未知数据上表现的场景中出现。下面是对公式的逐项解释:
-
E ote ( L a ∣ X , f ) E_{\text{ote}}(\mathfrak{L}_{a} | X, f) Eote(La∣X,f):这是在给定数据集 $X $和模型 $f $的情况下,对于某个损失函数 L a \mathfrak{L}_{a} La的离线期望。
-
∑ h \sum_{h} ∑h:这是对所有可能的模型 h h h的求和。在某些情况下,$h $可能代表不同的策略或决策函数。
-
∑ x ∈ X − X \sum_{\boldsymbol{x} \in \mathcal{X}-X} ∑x∈X−X:这是对所有不在数据集 $X $中的样本 $\boldsymbol{x} $的求和,其中 $\mathcal{X} $表示所有可能的样本空间。
-
P ( x ) P(\boldsymbol{x}) P(x):这是样本 x \boldsymbol{x} x在整个样本空间 $\mathcal{X} $中的概率分布。
-
I ( h ( x ) ≠ f ( x ) ) \mathbb{I}(h(\boldsymbol{x}) \neq f(\boldsymbol{x})) I(h(x)=f(x)):这是指示函数(Indicator Function),当 h ( x ) h(\boldsymbol{x}) h(x)和 f ( x ) f(\boldsymbol{x}) f(x)不相等时(即模型 h h h和 f f f对样本 x \boldsymbol{x} x的预测不一致时),其值为 1;否则为 0。
-
P ( h ∣ X , L a ) P(h | X, \mathfrak{L}_{a}) P(h∣X,La):这是在给定数据集 X X X和损失函数 L a \mathfrak{L}_{a} La的条件下,选择模型 h h h的概率。
整个公式的意思是,对于不在训练数据集 X X X 中的每个样本 x x x,计算所有可能的模型 h h h 和当前模型 f f f 在该样本上的预测不一致的概率,然后对所有这些概率进行加权求和,其中权重是样本 x x x 的概率分布 P ( x ) P(x) P(x) 和在给定数据集和损失函数下选择模型 h h h 的概率 P ( h ∣ X , L a ) P(h∣X,La) P(h∣X,La)。这个期望值可以用来评估模型 f f f 在未知数据上的泛化能力。