<贝叶斯基本公式与理解> 的姊妹篇。
多元正态分布(multivariate normal distribution)
fX(x1,…,xN)=1(2π)N/2|Σ|1/2exp(−12(x−μ)TΣ−1(x−μ))
一维、二维高斯分布
一维:
f(x)=12π−−√σexp(−x22σ2)
二维:
f(x,y)=12πσ2exp(−x2+y22σ2)
最大似然
单高斯(非高斯混合,gauss mixture model)的情形:
L(θ={θ,Σ}|X)=logP(X|θ)=∑i=1NlogP(xi|θ)=∑i=1NlogN(xi|θ,Σ)
其中 logL(θ|X) 被称为 log Likelihood function ,其中 μMLE=∂L(θ|X)∂μ , ΣMLE=∂L(θ|X)∂Σ
=∂(∑Ni=1log1σ2π√exp(−12(xi−μ)2σ2))∂μ=∂∑Ni=1log[exp(−12(xi−μ)2σ2)]∂μ=∂∑Ni=1(xi−μ)2∂μ=∑i=1N(xi−μ)=0⇒∑i=1Nxi=∑i=1Nμ⇒μMLE=1N∑i=1Nxi
=∂(∑Ni=1log1σ2π√exp(−12(xi−μ)2σ2))∂σ⇒σ2MLE=∑Ni=1(xi−μMLE)2N
也即
μMLE
是所有样本的均值;
σ2MLE
是所有样本方差的均值;
根据单个高斯模型通过最大似然估计的方法得到的样本均值和方差为如下的作图(二维数据)所示(显然十分牵强,高斯分布的情况下,均值附近的样本应当是最密集的):
下图为三个高斯叠加的结果(红线部分):