数学期望 Expectation

本文探讨数学期望 Expectation 在机器学习中的重要性,包括其定义、运算规则和在泛化误差分解中的作用。通过期望可以理解模型的偏差(Bias)和方差(Variance),从而更好地分析模型的欠拟合和过拟合问题。
摘要由CSDN通过智能技术生成

数学期望 Expectation

序言

机器学习中涉及到的很多概念都和 Expectation 相关联,例如:

  • 任何分布,我们都关心其 均值 mean、方差 variance、峰度 kurtosis、偏度 skewness;实际上都和数据期望相关;这些内容还和 中心距 以及 泰勒级数 相关联
  • 机器学习中,针对模型的泛化能力 Generalization,常见对 泛化误差 decompose 为 Bias(偏差,欠拟合) 和 Variance(方差,过拟合)。这一过程就是利用 Expectation 推导的
  • 最大期望算反 EM,明显地和 Expectation 有关联,其是利用了 Expectation 进行推导

所以本文特此明确一下这个基础概念。

期望的定义

The average value of some function f(x) under a probability distribution p(x) is called the expectation of f(x) .

如果 p(x) 是均匀分布的话,我们其实就是求一个函数 f(x) 的平均值而已;如果函数不同的值出现概率不同,我们当然要考虑 p(x) ,来求解真正期望出现的值。标准公式如下(discrete or continuous):

E[f]=xp(x)f(x)    or    E[f]=p(x)f(x)dx

  • 期望的操作符号特意用了 E 和一般的 error E 区分开。
  • 期望的核心在于函数值分布 p(x) 。其实根据不同的分布我们还能拓展期望的概念,例如 p(x|y) 的条件分布,可以产出 条件期望 conditional expectation;本文不予展开。
  • 另外,统计中的 期望,在几何也有对应的 重心,是一个对质量函数的加权积分。

采样 sample

我们不一定能精确地用公式求解出 E[f] ,但我们可以直接对 f(x) 采样,采样得到的值直接求均值 sample mean 来近似出 E[f] (函数期望 约为 函数采样均值 ):

E[f]1Ni=1Nf(xi)

N 趋向无穷大,约等于 变为 等于。

运算规则

期望 Expectation 作为一个运算符,有着如下4条运算规则:

(假设 c 为一个常量)

  • E(c)=c
  • E(cX)=cE(X)
  • E(X+Y)=E(X)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值