Beta分布&二项分布, 狄利克雷分布&多项式分布

最新推荐文章于 2024-08-24 14:45:28 发布

一只干巴巴的海绵

最新推荐文章于 2024-08-24 14:45:28 发布

阅读量1.5k

点赞数 1

分类专栏：统计

本文链接：https://blog.csdn.net/Hanx09/article/details/104969988

版权

统计专栏收录该内容

5 篇文章 8 订阅

订阅专栏

共轭分布

Beta分布是二项分布的共轭先验分布

在 $n$ 次独立重复试验中，每次试验结果只有两种，发生和不发生，发生概率为 $p$ ， $n$ 次试验中发生的次数 $X$ 服从二项分布 $X\sim B(n,p)$ ：
$P(X=k)=C_n^k p^k(1-p)^{n-k}$
Beta分布 $X\sim Be(\alpha,\beta)$ ：
$\frac{1}{B(\alpha,\beta)} x^{\alpha-1}(1-x)^{\beta-1},\quad x\in[0,1],\alpha,\beta>0$
$\frac{1}{B(\alpha,\beta)} =\frac{\Gamma(\alpha+\beta)}{\Gamma(\alpha)+\Gamma(\beta)},\quad \Gamma(z)=\int_0^\infty t^{z-1}e^{-t}dt$
$\Gamma(z+1)=z\Gamma(z), \Gamma(1)=1$
Beta分布的期望：
$\begin{aligned} E[X]&=\int x \frac{\Gamma(\alpha+\beta)}{\Gamma(\alpha)+\Gamma(\beta)} x^{\alpha-1}(1-x)^{\beta-1} dx\\ &=\frac{\Gamma(\alpha+\beta)}{\Gamma(\alpha)+\Gamma(\beta)}\int x^\alpha (1-x)^{\beta-1} dx\\ &=\frac{\Gamma(\alpha+\beta)}{\Gamma(\alpha)+\Gamma(\beta)}\frac{\Gamma(\alpha+1)+\Gamma(\beta)}{\Gamma(\alpha+\beta+1)}\\ &=\frac{\alpha}{\alpha+\beta} \end{aligned}$

假设先验分布 $\Theta\sim Be(\alpha,\beta)$ ：
$p(\theta)=\frac{1}{B(\alpha,\beta)} \theta^{\alpha-1}(1-\theta)^{\beta-1}$
似然函数 $X|\Theta\sim B(n,\theta)$ ：
$p(X=k|\Theta=\theta)= C_n^k \theta^k(1-\theta)^{n-k}$
则后验概率 $\Theta|X=k\sim Be(\alpha+k,\beta+n-k)$ ：
$\begin{aligned} p(X=k|\Theta=\theta)p(\theta)&=C_n^k \theta^k(1-\theta)^{n-k} \frac{1}{B(\alpha,\beta)} \theta^{\alpha-1}(1-\theta)^{\beta-1}\\ &=C_n^k \frac{\Gamma(\alpha+\beta)}{\Gamma(\alpha)+\Gamma(\beta)}\theta^{\alpha+k-1}(1-\theta)^{\beta+n-k-1}\\ &=C\theta^{\alpha+k-1}(1-\theta)^{\beta+n-k-1} \end{aligned}$
$\begin{aligned} p(X=k)&=\int p(X=k|\Theta=\theta)p(\theta)d\theta\\ &=C\int\theta^{\alpha+k-1}(1-\theta)^{\beta+n-k-1}d\theta\\ &=C B(\alpha+k,\beta+n-k) \end{aligned}$
$p(\theta|X=k)=\frac{p(X=k|\Theta=\theta)p(\theta)}{p(X=k)}= \frac{1}{B(\alpha+k,\beta+n-k)}\theta^{\alpha+k-1}(1-\theta)^{\beta+n-k-1}$

狄利克雷分布是多项式分布的共轭先验分布

在 $n$ 次独立重复试验中，每次试验结果有 $k$ 个： $A_1,...,A_k$ ，每个结果出现的概率为 $p_1,...,p_k$ ， $n$ 次独立重复试验中每个结果出现的次数 $X_1,...,X_k$ 服从多项式分布 $X\sim multi(X_1,...,X_k;p_1,...,p_k)$ ：
$P(X_1=n_1,...,X_k=n_k)=\frac{n!}{n_1!...n_k!}\prod_{i=1}^kp_i^{n_i}$
$\sum_{i=1}^kp_i=1,p_i>0$
狄利克雷分布 $X\sim Dir(X_1,...,X_k;\alpha_1,...,\alpha_k)$ ：
$f(x_1,..,x_k)=\frac{1}{B(\alpha_1,...,\alpha_k)}\prod_{i=1}^kx_i^{\alpha_i-1}$
$B(\alpha_1,...,\alpha_k)=\frac{\prod_{i=1}^k\Gamma(\alpha_i)}{\Gamma(\sum_{i=1}^k\alpha_i)}, \sum_{i=1}^k x_i=1, \alpha_i>0\forall i$
狄利克雷分布的期望：
$\begin{aligned} E[X_j]&=\int x_j \frac{1}{B(\alpha_1,...,\alpha_k)}\prod_{i=1}^kx_i^{\alpha_i-1} dx_1...dx_k\\ &=\frac{1}{B(\alpha_1,...,\alpha_k)}\int x_j^{\alpha_j}dx_j\prod_{i\neq j}^k\int x_i^{\alpha_i-1}dx_i\\ &=\frac{B(\alpha_1,...,\alpha_j+1,...,\alpha_k)}{B(\alpha_1,...,\alpha_j,...,\alpha_k)}\\ &=\frac{\alpha_j}{\sum_{i=1}^k\alpha_i} \end{aligned}$

假设先验分布 $\Theta_1,...,\Theta_k\sim Dir(\alpha_1,...,\alpha_k)$ ：
$p(\theta_1,..,\theta_k)=\frac{1}{B(\alpha_1,...,\alpha_k)}\prod_{i=1}^k\theta_i^{\alpha_i-1}$
似然函数 $X_1,...,X_k|\Theta_1,...,\Theta_k\sim multi(\theta_1,..,\theta_k)$ ：
$p(n_1,...,n_k|\theta_1,..,\theta_k)=\frac{n!}{n_1!...n_k!}\prod_{i=1}^k\theta_i^{n_i}$
则后验概率 $\Theta_1,...,\Theta_k|X_1=n_1,...,X_k=n_k\sim Dir(\alpha_1+n_1,...,\alpha_k+n_k)$ ：
$\begin{aligned} p(n_1,...,n_k|\theta_1,..,\theta_k)p(\theta_1,..,\theta_k)&=\frac{n!}{n_1!...n_k!}\prod_{i=1}^k\theta_i^{n_i}\frac{\prod_{i=1}^k\Gamma(\alpha_i)}{\Gamma(\sum_{i=1}^k\alpha_i)}\prod_{i=1}^k\theta_i^{\alpha_i-1}\\ &=\frac{n!}{n_1!...n_k!}\frac{\prod_{i=1}^k\Gamma(\alpha_i)}{\Gamma(\sum_{i=1}^k\alpha_i)}\prod_{i=1}^k\theta_i^{\alpha_i+n_i-1}\\ &=C\prod_{i=1}^k\theta_i^{\alpha_i+n_i-1} \end{aligned}$
$\begin{aligned} p(n_1,...,n_k)&=\int p(n_1,...,n_k|\theta_1,..,\theta_k)p(\theta_1,..,\theta_k)d\theta\\ &=C\int\prod_{i=1}^k\theta_i^{\alpha_i+n_i-1}d\theta\\ &=C B(\alpha_1+n_1,...,\alpha_k+n_k) \end{aligned}$
$\begin{aligned} p(\theta_1,..,\theta_k|n_1,...,n_k)&=\frac{p(n_1,...,n_k|\theta_1,..,\theta_k)p(\theta_1,..,\theta_k)}{p(n_1,...,n_k)}\\ &= \frac{1}{ B(\alpha_1+n_1,...,\alpha_k+n_k)}\prod_{i=1}^k\theta_i^{\alpha_i+n_i-1} \end{aligned}$