数学期望 Expectation

最新推荐文章于 2025-03-06 22:53:29 发布

爱学习的段哥哥

最新推荐文章于 2025-03-06 22:53:29 发布

阅读量5.5k

点赞数 1

分类专栏：统计理论文章标签：数学机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Cdd2xd/article/details/72794249

版权

本文探讨数学期望 Expectation 在机器学习中的重要性，包括其定义、运算规则和在泛化误差分解中的作用。通过期望可以理解模型的偏差（Bias）和方差（Variance），从而更好地分析模型的欠拟合和过拟合问题。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

数学期望 Expectation

序言

机器学习中涉及到的很多概念都和 Expectation 相关联，例如：

任何分布，我们都关心其均值 mean、方差 variance、峰度 kurtosis、偏度 skewness；实际上都和数据期望相关；这些内容还和中心距以及泰勒级数相关联
机器学习中，针对模型的泛化能力 Generalization，常见对泛化误差 decompose 为 Bias（偏差，欠拟合）和 Variance（方差，过拟合）。这一过程就是利用 Expectation 推导的
最大期望算反 EM，明显地和 Expectation 有关联，其是利用了 Expectation 进行推导

所以本文特此明确一下这个基础概念。

期望的定义

The average value of some function $f(x)$ under a probability distribution $p(x)$ is called the expectation of $f(x)$ .

如果 $p(x)$ 是均匀分布的话，我们其实就是求一个函数 $f(x)$ 的平均值而已；如果函数不同的值出现概率不同，我们当然要考虑 $p(x)$ ，来求解真正期望出现的值。标准公式如下（discrete or continuous）：

E [f] = \sum x p (x) f (x) o r E [f] = \int p (x) f (x) d x

$\mathbf{E}[f]=\sum_x{p(x)f(x)}\ \ \ \ or\ \ \ \ \mathbf{E}[f]=\int{p(x)f(x)dx}$

期望的操作符号特意用了 $\mathbf{E}$ 和一般的 error $E$ 区分开。
期望的核心在于函数值分布 $p(x)$ 。其实根据不同的分布我们还能拓展期望的概念，例如 p(x|y) 的条件分布，可以产出条件期望 conditional expectation；本文不予展开。
另外，统计中的期望，在几何也有对应的重心，是一个对质量函数的加权积分。

采样 sample

我们不一定能精确地用公式求解出 $\mathbf{E}[f]$ ，但我们可以直接对 $f(x)$ 采样，采样得到的值直接求均值 sample mean 来近似出 $\mathbf{E}[f]$ （函数期望约为函数采样均值）：

E [f] \approx 1 N \sum i = 1 N f (x i)

$\mathbf{E}[f]\approx\frac{1}{N}\sum_{i=1}^N{f(x_i)}$
当

N $N$ 趋向无穷大，约等于变为等于。

运算规则

期望 Expectation 作为一个运算符，有着如下4条运算规则：

（假设 $c$ 为一个常量）

$\mathbf{E}(c) = c$
$\mathbf{E}(cX) = c\mathbf{E}(X)$
E(X+Y)=E(X)

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。