多元高斯分布的方差最大似然估计

东风笑西风

已于 2023-06-07 12:27:09 修改

阅读量1k

点赞数 1

文章标签：机器学习概率论算法

于 2023-06-07 12:18:40 首次发布

本文链接：https://blog.csdn.net/newbeixue/article/details/131085169

版权

文章介绍了如何使用最大似然估计法来估计多元高斯分布的均值向量μ和协方差矩阵Σ。首先，通过最大化样本数据的联合概率密度函数，求得均值μ的估计值为所有样本的均值。接着，通过同样的方法，计算出协方差矩阵Σ的估计值为所有样本与均值之差的outerproduct的平均。这些估计适用于独立同分布的样本数据。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

多元高斯分布是指多维随机变量的联合概率密度函数服从高斯分布，通常用以下公式表示：

$p(\boldsymbol{x}) = \frac{1}{(2\pi)^{d/2}|\boldsymbol{\Sigma}|^{1/2}}\exp\left(-\frac{1}{2}(\boldsymbol{x}-\boldsymbol{\mu})^T\boldsymbol{\Sigma}^{-1}(\boldsymbol{x}-\boldsymbol{\mu})\right)$

其中， $\boldsymbol{x}$ 是一个 $d$ 维的向量， $\boldsymbol{\mu}$ 是一个 $d$ 维的均值向量， $\boldsymbol{\Sigma}$ 是一个 $\times d$ 的协方差矩阵。

我们的目标是要通过样本数据来估计参数 $\boldsymbol{\mu}$ 和 $\boldsymbol{\Sigma}$ 的值。根据最大似然估计的原理，我们需要找到一组参数 $\boldsymbol{\mu}_{ML}$ 和 $\boldsymbol{\Sigma}_{ML}$ ，使得样本数据在这组参数下出现的概率最大。

首先，我们考虑均值 $\boldsymbol{\mu}$ 的最大似然估计。假设我们有 $N$ 个样本数据 $\boldsymbol{x}_1, \boldsymbol{x}_2, \cdots, \boldsymbol{x}_N$ ，我们的目标是最大化这些样本数据在多元高斯分布下的联合概率密度函数。可以写成如下形式：

$\begin{aligned} L(\boldsymbol{\mu}, \boldsymbol{\Sigma}) &= \prod_{n=1}^N p(\boldsymbol{x}_n) \ &= \prod_{n=1}^N \frac{1}{(2\pi)^{d/2}|\boldsymbol{\Sigma}|^{1/2}}\exp\left(-\frac{1}{2}(\boldsymbol{x}_n-\boldsymbol{\mu})^T\boldsymbol{\Sigma}^{-1}(\boldsymbol{x}_n-\boldsymbol{\mu})\right) \ &= \frac{1}{(2\pi)^{Nd/2}|\boldsymbol{\Sigma}|^{N/2}}\exp\left(-\frac{1}{2}\sum_{n=1}^N(\boldsymbol{x}_n-\boldsymbol{\mu})^T\boldsymbol{\Sigma}^{-1}(\boldsymbol{x}_n-\boldsymbol{\mu})\right) \end{aligned}$

对上式取对数，并对 $\boldsymbol{\mu}$ 求偏导数，并令其等于零，可以得到如下的最大似然估计：

$\boldsymbol{\mu}_{ML} = \frac{1}{N}\sum_{n=1}^N \boldsymbol{x}_n$

接下来，我们考虑协方差矩阵 $\boldsymbol{\Sigma}$ 的最大似然估计。同样地，我们要找到一组参数 $\boldsymbol{\Sigma}_{ML}$ ，使得样本数据在这组参数下出现的概率最大。同样地，我们对样本数据的联合概率密度函数取对数，然后对 $\boldsymbol{\Sigma}$ 求偏导数，并令其等于零，可以得到如下的最大似然估计：