南瓜书公式详解--------第一章绪论（1个公式）

dengkeaway

于 2024-08-15 13:37:47 发布

阅读量580

点赞数 14

分类专栏：南瓜书公式学习文章标签：机器学习深度学习人工智能

本文链接：https://blog.csdn.net/dengkeaway/article/details/141219756

版权

南瓜书公式学习专栏收录该内容

9 篇文章 0 订阅

订阅专栏

南瓜书公式详解--------第一章绪论
式（1.1)
$E_{o t e}\left(\mathfrak{L}_{a} | X, f\right)=\sum_{h} \sum_{\boldsymbol{x} \in \mathcal{X}-X} P(\boldsymbol{x}) \mathbb{I}(h(\boldsymbol{x}) \neq f(\boldsymbol{x})) P\left(h | X, \mathfrak{L}_{a}\right)$
公式是关于一个特定的数学期望 $E_{ote}$ 的表达式，通常称为“离线期望”（Out-of-Time Expectation），在机器学习中，特别是在评估模型的泛化能力时使用。这个公式可能在讨论集成学习、强化学习或其他需要评估模型在未知数据上表现的场景中出现。下面是对公式的逐项解释：

$E_{\text{ote}}(\mathfrak{L}_{a} | X, f)$ ：这是在给定数据集 $X $和模型 $f $的情况下，对于某个损失函数 $\mathfrak{L}_{a}$ 的离线期望。
$\sum_{h}$ ：这是对所有可能的模型 $h$ 的求和。在某些情况下，$h $可能代表不同的策略或决策函数。
$\sum_{\boldsymbol{x} \in \mathcal{X}-X}$ ：这是对所有不在数据集 $X $中的样本 $\boldsymbol{x} $的求和，其中 $\mathcal{X} $表示所有可能的样本空间。
$P(\boldsymbol{x})$ ：这是样本 $\boldsymbol{x}$ 在整个样本空间 $\mathcal{X} $中的概率分布。
$\mathbb{I}(h(\boldsymbol{x}) \neq f(\boldsymbol{x}))$ ：这是指示函数（Indicator Function），当 $h(\boldsymbol{x})$ 和 $f(\boldsymbol{x})$ 不相等时（即模型 $h$ 和 $f$ 对样本 $\boldsymbol{x}$ 的预测不一致时），其值为 1；否则为 0。
$\mathfrak{L}_{a})$ ：这是在给定数据集 $X$ 和损失函数 $\mathfrak{L}_{a}$ 的条件下，选择模型 $h$ 的概率。

整个公式的意思是，对于不在训练数据集 $X$ 中的每个样本 $x$ ，计算所有可能的模型 $h$ 和当前模型 $f$ 在该样本上的预测不一致的概率，然后对所有这些概率进行加权求和，其中权重是样本 $x$ 的概率分布 $P (x)$ 和在给定数据集和损失函数下选择模型 $h$ 的概率 $P (h ∣ X, L a)$ 。这个期望值可以用来评估模型 $f$ 在未知数据上的泛化能力。

dengkeaway

关注

14
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
南瓜书公式详解--------第一章绪论（1个公式）

的表达式，通常称为“离线期望”（Out-of-Time Expectation），在机器学习中，特别是在评估模型的泛化能力时使用。这个公式可能在讨论集成学习、强化学习或其他需要评估模型在未知数据上表现的场景中出现。：这是对所有不在数据集 $X $中的样本 $\boldsymbol{x} $的求和，其中 $\mathcal{X} $表示所有可能的样本空间。在该样本上的预测不一致的概率，然后对所有这些概率进行加权求和，其中权重是样本。：这是在给定数据集 $X $和模型 $f $的情况下，对于某个损失函数。
复制链接

扫一扫