机器学习(十六)——多元正态分布(The multivariate normal distribution)

原文:http://cs229.stanford.edu/notes/cs229-notes2.pdf

n维的多元正态分布,也称为多元高斯分布,是用均值向量和协方差矩阵参数化的,其中Σ≥0是对称的和正半定的。也被写作,它的密度函数为


在上面的方程中,“|Σ|”表示矩阵Σ的行列式。

对于一个随机变量X分布的,均值是


向量值随机变量Z的协方差定义为。这是一个实值随机变量方差的概念.协方差也可以定义为。(你应该能够证明这两个定义是等价的。) 如果,那么


以下是高斯分布的密度的一些示例:


最左边的图表示均值为零(即2x1零向量)和协方差矩阵Σ=i(2x2恒等矩阵)的高斯分布。具有零均值和恒等协方差的高斯也称为标准正态分布。中间图为零均值高斯密度,Σ=0.6I。在最右边的图中,Σ=2I。我们看到,随着Σ变大,高斯变得更“分散”,当它变得更小,分布变得更“压缩”。

让我们来看看更多的例子。


以上数字分别表示均值为0的高斯矩阵和协方差矩阵。


最左边的图显示了熟悉的标准正态分布,我们发现,我们看到当我们在Σ中增加非对角线条目时,密度变得更“压缩”到45度线。当我们看同样三种密度的等值线时,我们可以更清楚地看到这一点:


下面是由可变Σ生成的最后一组示例:


对应的:


从最左边和中间的数字,我们看到,通过减少协方差矩阵的对角线元素,密度现在又变得“压缩”,但在相反的方向。最后,随着参数的变化,更一般的等高线将形成椭圆。

作为最后一组示例,修复Σ=I,通过改变变量,我们也可以移动密度的均值。


上面的数字是使用Σ=I生成的,并且分别




  • 29
    点赞
  • 132
    收藏
    觉得还不错? 一键收藏
  • 5
    评论
多元正态分布Multivariate Normal Distribution)是在多元统计分析中常用的一种概率分布模型。它是一种由多个正态分布组成的联合分布。 多元正态分布包含了多个随机变量,每个变量都服从正态分布。与单变量正态分布类似,多元正态分布也由均值向量和协方差矩阵所确定。 在多元正态分布中,均值向量代表各个随机变量的平均值。协方差矩阵则表示各个变量之间的关联性和变异性。 多元正态分布有许多重要的特性。首先,它是一个典型的钟形曲线,集中于均值处。其次,协方差矩阵描述了不同变量之间的相关性。如果两个变量具有正相关,则它们的取值趋于同时增加或减少;如果两个变量具有负相关,则一个变量增加时,另一个变量会减小。最后,多元正态分布还具备线性组合的性质,即对于该分布中的多个随机变量,其线性组合也是正态分布。 多元正态分布在许多领域有着广泛的应用,特别是在统计学、金融学、经济学、生物学和工程学等学科中。通过多元正态分布,我们可以对多个变量的分布进行建模和分析,理解它们之间的关系,并进行概率推断和假设检验。 总而言之,多元正态分布是多元统计分析领域中常用的概率分布模型,通过均值向量和协方差矩阵的参数化来描述多个随机变量之间的关系。它的应用广泛,在许多领域中起着重要的作用。
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值