文章包括的内容有:
- 一元高斯分布相乘的分布
- 多元高斯分布相乘的分布
- 一元高斯的卷积分布
- 应用:对多元高斯分布的参数推断
- 应用:高斯线性系统的推导
前三部分的参考文献Products and Convolutions of Gaussian Probability Density
Functions. P.A. Bromile。应用的内容来自"machine learning a probabilistic perspective"的第四章p119~p120页。
引言
高斯分布是一个很重要的连续分布形式,频繁出现应用场景和里也可以导出很多分布,如在典型的线性回归中对误差 ε \varepsilon ε的建模就是用的标准正态分布,统计学的学生   t   \, t\, t分布就是从正态分布中导出。随着贝叶斯统计学的广泛应用,相乘的高斯分布(高斯先验)等形式也出现在公式中,例如高斯线性系统,本文就这些形式进行说明。
一元高斯分布相乘
假设 p ( x 1 ) = N ( x ∣ μ 1 , σ 1 ) ,   p ( x 2 ) = N ( x ∣ μ 2 , σ 2 ) p(x_1)=\mathcal{N}(x\vert \mu_1,\sigma_1), \, p(x_2)=\mathcal{N}(x\vert \mu_2,\sigma_2) p(x1)=N(x∣μ1,σ1),p(x2)=N(x∣μ2,σ2)均是关于变量 x x x的分布,现想计算 p ( x 1 ) p ( x 2 ) p(x_1)p(x_2) p(x1)p(x2)的分布形式。
p ( x 1 ) p ( x 2 ) = e − 1 2 σ 1 2 ( x − μ 1 ) 2 e − 1 2 σ 2 2 ( x − μ 2 ) 2 = e − 1 2 ( σ 1 2 + σ 2 2 ) x 2 − 2 ( μ 1 σ 2 2 + μ 2 σ 1 2 ) x + constant σ 1 2 σ 2 2 \begin{aligned} p(x_1)p(x_2) & = e^{-\frac{1}{2\sigma_1^2}(x-\mu_1)^2}e^{-\frac{1}{2\sigma_2^2}(x-\mu_2)^2} \\ & =e^{-\frac{1}{2}\frac{(\sigma_1^2+\sigma_2^2)x^2-2(\mu_1\sigma_2^2+\mu_2\sigma_1^2)x+\text{constant}}{\sigma_1^2\sigma_2^2}}\end{aligned} p(x1)p(x2)=e−2σ121(x−μ1)2e−2σ221(x−μ2)2=e−21σ12σ22(σ12+σ22)x2−2(μ1σ22+μ2σ12)x+constant
得两个高斯分布相乘仍为缩放的高斯分布,通过配方得到缩放的高斯分布参数为:
μ = μ 1 σ 2 2 + μ 2 σ 1 2 σ 1 2 + σ 2 2 σ = σ 1 2 σ 2 2 σ 1 2 + σ 2 2 \begin{aligned} \mu & = \frac{\mu_1\sigma_2^2+\mu_2\sigma_1^2}{\sigma_1^2+\sigma_2^2} \\ \sigma & = \sqrt{\frac{\sigma_1^2\sigma_2^2}{\sigma_1^2+\sigma_2^2}} \end{aligned} μσ=σ12+σ22μ1σ22+μ2σ12=σ12+σ22σ12σ22
上式可写为如下形式,从而推广至 n n n个一维高斯分布相乘:
μ = ( μ 1 σ 1 2 + μ 2 σ 2 2 ) σ 2 1 σ 2 = 1 σ 1 2 + 1 σ 2 2 \begin{aligned} \mu &= (\frac{\mu_1}{\sigma_1^2}+\frac{\mu_2}{\sigma_2^2})\sigma^2 \\ \frac{1}{\sigma^2} &= \frac{1}{\sigma_1^2} + \frac{1}{\sigma_2^2} \end{aligned} μσ21=(σ12μ1+σ22μ