机器学习中的数学——期望、方差和协方差

分类目录:《算法设计与分析》总目录


函数 f ( x ) f(x) f(x)关于某分布 P ( x ) P(x) P(x)的期望或者期望值是指,当 x x x P P P产生, f f f作用于 x x x时, f ( x ) f(x) f(x)的平均值。对于离散型随机变量,这可以通过求和得到:
E x ∼ P [ f ( x ) ] = ∑ x f ( x ) P ( x ) E_{x \sim P}[f(x)] = \sum_x f(x) P(x) ExP[f(x)]=xf(x)P(x)

对于连续型随机变量可以通过求积分得到:
E x ∼ p [ f ( x ) ] = ∫ x f ( x ) p ( x ) d x E_{x \sim p}[f(x)] = \int_x f(x)p(x)dx Exp[f(x)]=xf(x)p(x)dx

当概率分布在上下文中指明时,我们可以只写出期望作用的随机变量的名称来进行简化,例如囻 E x [ f ( x ) ] E_{x}[f(x)] Ex[f(x)]。如果期望作用的随机变量也很明确,我们可以完全不写脚标,就像 E [ f ( x ) ] E[f(x)] E[f(x)]。默认地,我们假设 [ ⋅ ] [\cdot] []表示对方括号内的所有随机变量的值求平均。类似的,当没有歧义时,我们还可以省略方括号。

期望是线性的,例如:
E x [ α f ( x ) + β g ( x ) ] = α E x [ f ( x ) ] + β E x [ g ( x ) ] E_{x}[\alpha f(x)+\beta g(x)]=\alpha E_{x}[f(x)]+\beta E_{x}[g(x)] Ex[αf(x)+βg(x)]=αEx[f(x)]+βEx[g(x)]

其中 = α =\alpha =α β \beta β不依赖于 x x x

方差( variance)衡量的是当我们对x依据它的概率分布进行采样时,随机变量ⅹ的函数值会呈现多大的差异:
V a r [ f ( x ) ] = E [ ( f ( x ) − E [ f ( x ) ] ) 2 ] . \mathrm{Var}[f(x)] = E\left[\left(f(x) - E[f(x)]\right)^2\right]. Var[f(x)]=E[(f(x)E[f(x)])2].

当方差很小时, f ( x ) f(x) f(x)的值形成的簇比较接近它们的期望值。方差的平方根被称为标准差。

协方差在某种意义上给出了两个变量线性相关性的强度以及这些变量的尺度:
C o v ( f ( x ) , g ( y ) ) = E [ ( f ( x ) − E [ f ( x ) ] ) ( g ( y ) − E ( g ( y ) ) ) ] Cov(f(x), g(y))=E[(f(x)-E[f(x)])(g(y)-E(g(y)))] Cov(f(x),g(y))=E[(f(x)E[f(x)])(g(y)E(g(y)))]

协方差的绝对值如果很大则意味着变量值变化很大并且它们同时距离各自的均值很远。如果协方差是正的,那么两个变量都倾向于同时取得相对较大的值。如果协方差是负的,那么其中一个变量倾向于取得相对较大的值的同时,另一个变量倾向于取得相对较小的值,反之亦然。其他的衡量指标如相关系数将每个变量的贡献归一化,为了只衡量变量的相关性而不受各个变量尺度大小的影响。

协方差和相关性是有联系的,但实际上是不同的概念。它们是有联系的,因为两个变量如果相互独立那么它们的协方差为零,如果两个变量的协方差不为零那么它们一定是相关的。然而,独立性又是和协方差完全不同的性质。两个变量如果协方差为零,它们之间一定没有线性关系。独立性比零协方差的要求更强,因为独立性还排除了非线性的关系。两个变量相互依赖但具有零协方差是可能的。例如,假设我们首先从区间 [ − 1 , 1 ] [-1, 1] [1,1]上的均匀分布中采样出一个实数 x x x。然后我们对一个随机变量 s s s进行采样。 s s s 1 2 \frac{1}{2} 21的概率值为1,否则为-1。我们可以通过令 y = s x y=sx y=sx来生成个随机变量 y y y。显然, x x x y 不 y不 y是相互独立的,因为 x x x完全决定了 y y y的尺度。然而, C o v ( x , y ) = 0 Cov(x, y)=0 Cov(x,y)=0

随机向量 x ∈ R n x\in R^n xRn的协方差矩阵是一个 n × n n\times n n×n的矩阵,并且满足:
C o v ( x ) i , j = C o v ( x i , x j ) Cov(x)_{i, j}=Cov(x_i, x_j) Cov(x)i,j=Cov(xi,xj)

协方差矩阵的对角元是方差:
C o v ( x ) i , i = V a r ( x i ) Cov(x)_{i, i}=Var(x_i) Cov(x)i,i=Var(xi)

  • 7
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

von Neumann

您的赞赏是我创作最大的动力~

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值