正态分布的密度函数,可以一般化地写为
f ( x ) = k exp [ − 1 2 ( x − b ) ′ A ( x − b ) ] f(x) = k \exp\left[-\dfrac{1}{2}(x-b)' A (x-b)\right] f(x)=kexp[−21(x−b)′A(x−b)]
事实上,如果某个多维随机变量的密度函数可以写成该形式,那么它就服从正态分布。其中 b b b是均值,正定矩阵 A A A是协方差矩阵的逆,它们共同决定了正态分布的形式。而另外一个字母 k k k,仅仅是归一化系数,它是使得整个密度函数的积分等于 1 1 1的那个值。
如果有人背过公式,会发现这个系数的形式比较复杂。本文具体来看看,它是怎么计算出来的。
由于 A A A是正定的,必有分解 A = C C ′ A=CC' A=CC′。先做个变换,令 x − b = ( C ′ ) − 1 y x-b=(C')^{-1}y x−b=(C′)−1y,那么
( x − b ) ′ A ( x − b ) = y ′ C − 1 A ( C ′ ) − 1 y = y ′ y (x-b)' A (x-b) = y' C^{-1}A(C')^{-1}y = y'y (x−b)′A(x−b)=y′C−1A(C