设两个高斯分布 p ( x ) p(x) p(x) 和 q ( x ) q(x) q(x) 分别为:
p ( x ) = 1 2 π σ 1 e x p ( − ( x − μ 1 ) 2 2 σ 1 2 ) p(x) = \frac{1}{\sqrt{2\pi}\sigma_1}exp\left(-\frac{(x-\mu_1)^2}{2\sigma_1^2}\right) p(x)=2πσ11exp(−2σ12(x−μ1)2)
q ( x ) = 1 2 π σ 2 e x p ( − ( x − μ 2 ) 2 2 σ 2 2 ) q(x) = \frac{1}{\sqrt{2\pi}\sigma_2}exp\left(-\frac{(x-\mu_2)^2}{2\sigma_2^2}\right) q(x)=2πσ21exp(−2σ22(x−μ2)2)
我们想要计算这两个高斯分布的乘积 r ( x ) = p ( x ) q ( x ) r(x) = p(x)q(x) r(x)=p(x)q(x),即:
r ( x ) = 1 2 π σ 1 σ 2 e x p ( − ( x − μ 1 ) 2 2 σ 1 2 − ( x − μ 2 ) 2 2 σ 2 2 ) r(x) = \frac{1}{2\pi\sigma_1\sigma_2}exp\left(-\frac{(x-\mu_1)^2}{2\sigma_1^2}-\frac{(x-\mu_2)^2}{2\sigma_2^2}\right) r(x)=2πσ1σ21exp(−2σ12(x−μ1)2−2σ22(x−μ2)2)
为了得到这个结果,我们可以先将 r ( x ) r(x) r(x) 写成指数函数的形式:
r ( x ) = e x p ( − ( x − μ 1 ) 2 2 σ 1 2 − ( x − μ 2 ) 2 2 σ 2 2 − l n ( 2 π σ 1 σ 2 ) ) r(x) = exp\left(-\frac{(x-\mu_1)^2}{2\sigma_1^2}-\frac{(x-\mu_2)^2}{2\sigma_2^2}-ln(2\pi\sigma_1\sigma_2)\right) r(x)=exp(−2σ12(x−μ1)2−2σ22(x−μ2)2−ln(2πσ1σ2))
然后,我们可以通过将指数函数中的平方项展开并进行一些简单的代数操作来得到上述结果。具体来说,我们可以将 r ( x ) r(x) r(x) 中的平方项展开并将常数项合并,得到:
r ( x ) = e x p ( − 1 2 ( 1 σ 1 2 + 1 σ 2 2 ) x 2 + ( μ 1 σ 1 2 + μ 2 σ 2 2 ) x − μ 1 2 2 σ 1 2 − μ 2 2 2 σ 2 2 + l n 1 2 π σ 1 + l n 1 2 π σ 2 ) r(x) = exp\left(-\frac{1}{2}\left(\frac{1}{\sigma_1^2}+\frac{1}{\sigma_2^2}\right)x^2 + \left(\frac{\mu_1}{\sigma_1^2}+\frac{\mu_2}{\sigma_2^2}\right)x - \frac{\mu_1^2}{2\sigma_1^2}-\frac{\mu_2^2}{2\sigma_2^2}+ln\frac{1}{\sqrt{2\pi}\sigma_1}+ln\frac{1}{\sqrt{2\pi}\sigma_2}\right) r(x)=exp(−21(σ121+σ221)x2+(σ12μ1+σ22μ2)x−2σ12μ12−2σ22μ22+ln2πσ11+ln2πσ21)
我们可以将上式中的第一项看作是一个二次函数的系数,将其写成标准的二次函数形式,即:
r ( x ) = 1 2 π σ e x p ( − ( x − μ ) 2 2 σ 2 ) r(x) = \frac{1}{\sqrt{2\pi}\sigma}exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right) r(x)=2πσ1exp(−2σ2(x−μ)2)
其中,
σ 2 = 1 1 σ 1 2 + 1 σ 2 2 \sigma^2 = \frac{1}{\frac{1}{\sigma_1^2}+\frac{1}{\sigma_2^2}} σ2=σ121+σ2211
μ = σ 2 ( μ 1 σ 1 2 + μ 2 σ 2 2 ) \mu = \sigma^2\left(\frac{\mu_1}{\sigma_1^2}+\frac{\mu_2}{\sigma_2^2}\right) μ=σ2(σ12μ1+σ22μ2)
这就是将两个高斯分布相乘得到的结果。可以看到,结果仍然是一个高斯分布,其均值和方差分别是由原始两个高斯分布的均值和方差计算得到的新的均值和方差。这个方法在许多统计学和机器学习的应用中都非常有用。