多元高斯分布的方差最大似然估计

文章介绍了如何使用最大似然估计法来估计多元高斯分布的均值向量μ和协方差矩阵Σ。首先,通过最大化样本数据的联合概率密度函数,求得均值μ的估计值为所有样本的均值。接着,通过同样的方法,计算出协方差矩阵Σ的估计值为所有样本与均值之差的outerproduct的平均。这些估计适用于独立同分布的样本数据。
摘要由CSDN通过智能技术生成

多元高斯分布是指多维随机变量的联合概率密度函数服从高斯分布,通常用以下公式表示:

p ( x ) = 1 ( 2 π ) d / 2 ∣ Σ ∣ 1 / 2 exp ⁡ ( − 1 2 ( x − μ ) T Σ − 1 ( x − μ ) ) p(\boldsymbol{x}) = \frac{1}{(2\pi)^{d/2}|\boldsymbol{\Sigma}|^{1/2}}\exp\left(-\frac{1}{2}(\boldsymbol{x}-\boldsymbol{\mu})^T\boldsymbol{\Sigma}^{-1}(\boldsymbol{x}-\boldsymbol{\mu})\right) p(x)=(2π)d/2Σ1/21exp(21(xμ)TΣ1(xμ))

其中, x \boldsymbol{x} x 是一个 d d d 维的向量, μ \boldsymbol{\mu} μ 是一个 d d d 维的均值向量, Σ \boldsymbol{\Sigma} Σ 是一个 d × d d \times d d×d 的协方差矩阵。

我们的目标是要通过样本数据来估计参数 μ \boldsymbol{\mu} μ Σ \boldsymbol{\Sigma} Σ 的值。根据最大似然估计的原理,我们需要找到一组参数 μ M L \boldsymbol{\mu}_{ML} μML Σ M L \boldsymbol{\Sigma}_{ML} ΣML,使得样本数据在这组参数下出现的概率最大。

首先,我们考虑均值 μ \boldsymbol{\mu} μ 的最大似然估计。假设我们有 N N N 个样本数据 x 1 , x 2 , ⋯   , x N \boldsymbol{x}_1, \boldsymbol{x}_2, \cdots, \boldsymbol{x}_N x1,x2,,xN,我们的目标是最大化这些样本数据在多元高斯分布下的联合概率密度函数。可以写成如下形式:

L ( μ , Σ ) = ∏ n = 1 N p ( x n )   = ∏ n = 1 N 1 ( 2 π ) d / 2 ∣ Σ ∣ 1 / 2 exp ⁡ ( − 1 2 ( x n − μ ) T Σ − 1 ( x n − μ ) )   = 1 ( 2 π ) N d / 2 ∣ Σ ∣ N / 2 exp ⁡ ( − 1 2 ∑ n = 1 N ( x n − μ ) T Σ − 1 ( x n − μ ) ) \begin{aligned} L(\boldsymbol{\mu}, \boldsymbol{\Sigma}) &= \prod_{n=1}^N p(\boldsymbol{x}_n) \ &= \prod_{n=1}^N \frac{1}{(2\pi)^{d/2}|\boldsymbol{\Sigma}|^{1/2}}\exp\left(-\frac{1}{2}(\boldsymbol{x}_n-\boldsymbol{\mu})^T\boldsymbol{\Sigma}^{-1}(\boldsymbol{x}_n-\boldsymbol{\mu})\right) \ &= \frac{1}{(2\pi)^{Nd/2}|\boldsymbol{\Sigma}|^{N/2}}\exp\left(-\frac{1}{2}\sum_{n=1}^N(\boldsymbol{x}_n-\boldsymbol{\mu})^T\boldsymbol{\Sigma}^{-1}(\boldsymbol{x}_n-\boldsymbol{\mu})\right) \end{aligned} L(μ,Σ)=n=1Np(xn) =n=1N(2π)d/2Σ1/21exp(21(xnμ)TΣ1(xnμ)) =(2π)Nd/2ΣN/21exp(21n=1N(xnμ)TΣ1(xnμ))

对上式取对数,并对 μ \boldsymbol{\mu} μ 求偏导数,并令其等于零,可以得到如下的最大似然估计:

μ M L = 1 N ∑ n = 1 N x n \boldsymbol{\mu}_{ML} = \frac{1}{N}\sum_{n=1}^N \boldsymbol{x}_n μML=N1n=1Nxn

接下来,我们考虑协方差矩阵 Σ \boldsymbol{\Sigma} Σ 的最大似然估计。同样地,我们要找到一组参数 Σ M L \boldsymbol{\Sigma}_{ML} ΣML,使得样本数据在这组参数下出现的概率最大。同样地,我们对样本数据的联合概率密度函数取对数,然后对 Σ \boldsymbol{\Sigma} Σ 求偏导数,并令其等于零,可以得到如下的最大似然估计:

Σ M L = 1 N ∑ n = 1 N ( x n − μ M L ) ( x n − μ M L ) T \boldsymbol{\Sigma}_{ML} = \frac{1}{N}\sum_{n=1}^N (\boldsymbol{x}_n - \boldsymbol{\mu}_{ML})(\boldsymbol{x}_n - \boldsymbol{\mu}_{ML})^T ΣML=N1n=1N(xnμML)(xnμML)T

这个结果表明,协方差矩阵的最大似然估计可以通过样本数据的协方差矩阵来计算。如果我们假设样本数据是独立同分布的,则上述公式可以进一步简化为:

Σ M L = 1 N ∑ n = 1 N ( x n − μ M L ) ( x n − μ M L ) T \boldsymbol{\Sigma}_{ML} = \frac{1}{N}\sum_{n=1}^N (\boldsymbol{x}_n - \boldsymbol{\mu}_{ML})(\boldsymbol{x}_n - \boldsymbol{\mu}_{ML})^T ΣML=N1n=1N(xnμML)(xnμML)T

这个公式可以直接用于实际计算。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值