- 二项式分布的共轭分布是( C )
A. 正态分布
B. Dirichlet分布
C. Beta分布
D. 指数分布 - 多项式分布的共轭分布是( B )
A. 正态分布
B. Dirichlet分布
C. Beta分布
D. 指数分布
先看贝叶斯公式:
p
(
θ
∣
x
)
=
p
(
x
∣
θ
)
p
(
θ
)
∫
p
(
x
∣
θ
)
p
(
θ
)
d
θ
p(\theta|x)=\frac{p(x|\theta)p(\theta)}{\int p(x|\theta)p(\theta)d\theta}
p(θ∣x)=∫p(x∣θ)p(θ)dθp(x∣θ)p(θ)
其中,
p
(
θ
∣
x
)
p(\theta|x)
p(θ∣x)是后验概率posterior,
p
(
x
∣
θ
)
p(x|\theta)
p(x∣θ)是似然估计likelihood,
p
(
θ
)
p(\theta)
p(θ)是先验概率prior。分母是evidence,可以看作是做归一化正则化处理,不会影响后验的分布。
共轭分布: 如果将似然函数的分布和先验概率的分布带入贝叶斯公式,得到的后验分布和先验分布是同一个分布,那么就称似然函数分布和先验概率分布为共轭分布。
二项式分布与Beta分布为共轭分布推导:
假设先验概率服从beta分布,即
θ
∼
B
e
t
a
(
α
1
,
α
2
)
\theta\sim Beta(\alpha_1,\alpha_2)
θ∼Beta(α1,α2)
则,我们可以写成:
p
(
θ
∣
α
1
,
α
2
)
=
B
e
t
a
(
θ
∣
α
1
,
α
2
)
=
Γ
(
α
1
+
α
2
)
Γ
(
α
1
)
Γ
(
α
2
)
θ
α
1
−
1
(
1
−
θ
α
2
−
1
)
p(\theta|\alpha_1,\alpha_2)=Beta(\theta|\alpha_1,\alpha_2)=\frac{\Gamma(\alpha_1+\alpha_2)}{\Gamma(\alpha_1)\Gamma(\alpha_2)}\theta^{\alpha_1-1}(1-\theta^{\alpha_2-1})
p(θ∣α1,α2)=Beta(θ∣α1,α2)=Γ(α1)Γ(α2)Γ(α1+α2)θα1−1(1−θα2−1)
其中
Γ
\Gamma
Γ函数为阶乘函数。
同理,假设似然函数的分布为二项式分布,则可以写出:
p
(
x
∣
θ
,
n
)
=
(
x
n
)
θ
x
(
1
−
θ
)
n
−
x
p(x|\theta,n)=(^n_x)\theta^x(1-\theta)^{n-x}
p(x∣θ,n)=(xn)θx(1−θ)n−x
同时,
(
x
n
)
=
Γ
(
x
)
Γ
(
n
)
Γ
(
n
−
x
)
(^n_x)=\frac{\Gamma(x)}{\Gamma(n)\Gamma(n-x)}
(xn)=Γ(n)Γ(n−x)Γ(x)
故,
p
(
θ
∣
x
)
∝
p
(
θ
∣
α
1
,
α
2
)
p
(
x
∣
θ
,
n
)
=
B
e
t
a
(
α
1
+
x
,
α
2
+
n
−
x
)
p(\theta|x)\propto p(\theta|\alpha_1,\alpha_2)p(x|\theta,n)=Beta(\alpha_1+x,\alpha_2+n-x)
p(θ∣x)∝p(θ∣α1,α2)p(x∣θ,n)=Beta(α1+x,α2+n−x)
同时,分母evidence不影响分布。故,二项式分布与Beta分布为共轭分布。
除此之外,多项式分布和Dirichlet分布为共轭分布,泊松分布和伽马分布为共轭分布。笔者能力有限,推导需要不少时间,其他共轭分布暂不做推导。同时考试也大概率不会涉及,仅需记住即可。