Dirichlet distribution 狄利克雷分布

REGRET ER

已于 2022-07-15 12:02:41 修改

阅读量159

点赞数

分类专栏： Data Mining 文章标签：概率论机器学习算法

于 2022-05-24 20:52:34 首次发布

本文链接：https://blog.csdn.net/asybk/article/details/124949427

版权

Data Mining 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

文章目录

一些函数

$G amma$ 函数
$\Gamma(x)=\int_{0}^{\infty} t^{x-1} e^{-t} d t$
贝叶斯概率
$\pi(\theta \mid x)=\frac{f(x \mid \theta) \pi(\theta)}{\int_{\Theta} f(x \mid \theta) \pi(\theta) d \theta}$
$B e t a$ 函数
$\mathrm{B}(m, n)=\int_{0}^{1} x^{m-1}(1-x)^{n-1} d x$
$B e t a$ 函数和 $G amma$ 函数的关系
$\mathrm{B}(m, n)=\frac{\Gamma(n) \Gamma(m)}{\Gamma(m+n)}$

换元 $x=\cos ^{2} \theta$ 得
$\mathrm{B}(m,n) = -2 \int_{\frac{\pi}{2}}^{0}\left(\sin ^{2 n-2} \theta\right)\left(\cos ^{2 m-2} \theta\right)(\sin \theta)(\cos \theta) d x=2 \int_{0}^{\frac{\pi}{2}}\left(\sin ^{2 n-1} \theta\right)\left(\cos ^{2 m-1} \theta\right) d \theta \text { (a) }$ 考虑Gamma函数 $\Gamma(n)=\int_{0}^{+\infty} e^{-x} x^{n-1} d x$ ，换元 $x=y^{2}$ ，得 $\Gamma(n)=2 \int_{0}^{+\infty} e^{-y^{2}} y^{2 n-1} d y$
同样， $\Gamma(m)=2 \int_{0}^{+\infty} e^{-z^{2}} y^{2 z-1} d y$
那么， $\Gamma(n) \Gamma(m)=4 \int_{0}^{+\infty} \int_{0}^{+\infty} e^{-y^{2}-z^{2}} y^{2 n-1} z^{2 m-1} dy dz$
令 $\cos \theta, z=x \sin \theta$ ，
$\begin{aligned}\Gamma(n) \Gamma(m)&=\int_{0}^{\frac{\pi}{2}} \int_{0}^{+\infty} e^{-x^{2}} x^{2 m+2 n-1}\left(\sin ^{2 n-1} \theta\right)\left(\cos ^{2 m-1} \theta\right) d x d \theta=\left[2 \int_{0}^{+\infty} e^{-x^{2}} x^{2 m+2 n-1} d x\right]\left[2 \int_{0}^{\frac{\pi}{2}}\left(\sin ^{2 n-1} \theta\right)\left(\cos ^{2 m-1} \theta\right) d \theta\right]\\&=\Gamma(m+n)\mathrm{B}(m,n)\end{aligned}$

二项分布

二项分布 = 伯努利分布，
记为 $X\sim b(n,\theta)$ ， $n$ 次抛硬币中获得 $k$ 次正面的概率为：
$b(k,n,\theta) = P(X=k) = C(n,k) \times \theta^k \times (1-\theta)^{n-k}$

Beta分布

是指一组定义在 $(0, 1)$ 区间的连续概率分布，有两个参数 $\alpha , \beta > 0$ ，称为形状参数。Beta分布定义了二项分布的参数 $\theta$ 的分布，或者说 先验分布。
$Beta(\theta; \alpha, \beta)=\frac{\theta^{\alpha-1}(1-\theta)^{\beta-1}}{\mathrm{B}(\alpha, \beta)} = \frac{\Gamma(\alpha+\beta)}{\Gamma(\alpha)\Gamma(\beta)}\ \theta^{\alpha-1}(1-\theta)^{\beta-1}$

Beta分布与二项分布是 共轭先验 的（Conjugate prior）。即Beta分布乘上一个二项分布的似然函数后，得到的后验分布仍然是一个Beta分布。
$Beta(\theta; \alpha_0, \beta_0) \times b(hits, hits+misses,\theta) = Beta(\theta; α_0+hits,β_0+misses)$

实例

多项式分布

记为 $X～PN(n,p_1,p_2, …,p_k)$
假设随机试验有 $k$ 个可能的结果 $A_1,A_2,..., A_k$ ，每个结果出现的次数为随机变量 $X_1,X_2,...,X_n$ ，每个结果出现的概率为 $p_1,p_2,...,p_k$ 。 $n$ 次独立重复试验中随机事件出现的次数分别为 $n_1,n_2,...,n_k$ 的概率符合 多项式分布。
$P\left(X_{1}=n_{1}, X_{2}=n_{2}, \ldots, X_{k}=n_{k}\right)=\frac{n !}{n_{1} ! n_{2} ! \ldots n_{k} !} p_{1}^{n_{1}} p_{2}^{n_{2}} \ldots p_{k}^{n_{k}}$

Dirichlet 分布

$D i r i c h l e t$ 分布是多项式分布的参数的分布，与多项分布是共轭先验的。即 $D i r i c h l e t$ 分布乘上一个多项分布的似然函数后，得到的后验分布仍然是一个 $D i r i c h l e t$ 分布。
$Dirichlet\left(\theta_{1}, \ldots, \theta_{K} ; \alpha_{1}, \ldots, \alpha_{K}\right)=\frac{1}{\mathrm{~B}(\bm{\alpha})} \prod_{i=1}^{K} \theta_{i}^{\alpha_{i}-1} = \frac{\Gamma(\sum_{i=1}^{K}\alpha_i)}{\prod_{i=1}^{K} \Gamma(\alpha_i)}\prod_{i=1}^{K} \theta_{i}^{\alpha_{i}-1}$