LDA数学八卦笔记

最新推荐文章于 2020-12-03 21:52:43 发布

无聊的人生事无聊

最新推荐文章于 2020-12-03 21:52:43 发布

阅读量923

点赞数

分类专栏：信息科学文章标签：机器学习 LDA

本文链接：https://blog.csdn.net/Wangpeiyi9979/article/details/100513083

版权

信息科学专栏收录该内容

159 篇文章 1 订阅

订阅专栏

前言

此博客是个人LDA学习总结中的一篇。用来记录LDA数学八卦的阅读笔记。

文章目录

一、神奇的Gamma函数
二、认识Beta/Dirichlet分布
三、MCMC和Gibbs Sampling

一、神奇的Gamma函数

Gamma函数 $\Gamma(x)$ 形式复杂，起源于哥德巴赫对 $n!$ 数列插值的研究。并且为了使得 $B e t a$ 函数表示简便，使得 $\Gamma(n) = (n-1)!$ 。

Gamma函数具有很大的魅力。比如(1) 由它定义了分数阶导数。(2)它和黎曼函数有联系。(3)它和欧拉常数有联系。等等

Gamma分布与泊松分布、二项分布、Beta分布有重要联系。我们可以通过：(1)二项分布和Beta分布关系恒等式。(2)二项分布的极限是泊松分布。进而推出Gamma分布。

该节的重要知识点关系可由下图表示：
在这里插入图片描述

二、认识Beta/Dirichlet分布

作者在此小结构造了4个游戏。深入浅出讲解了Beta分布和Dirichlet分布。

四个游戏分别为:

1、Beta分布游戏

在这里插入图片描述
经过推导，我们得到分布为
$f(X_{(k)})=Beta(X_{(k)}|\alpha, \beta)=\frac{\Gamma(\alpha+\beta)}{\Gamma(\alpha)+\Gamma(\beta)}x^{\alpha-1}(1-x)^{\beta-1}$

参数 $\alpha, \beta$ 的物理意义是伪计数，如下图所示:

在这里插入图片描述

$\alpha=k$ : 落在 $[0, x)$ 区域的数的个数加一。
$\beta=n-k+1$ : 落在( $x+\Delta x, 1]$ 的数的个数加一。

$Beta(X_a|\alpha, \beta)$ 分布的物理意义：从 $U n i f o r m (0, 1)$ 中采样 $\alpha+\beta-1$ 个数，第 $\alpha$ 大数所在位置 $X_1$ 的分布。

根据 $B e t a (k, n - k + 1)$ 分布的物理含义，我们也很容易证明二项分布的重要恒等式:

在这里插入图片描述

2、Beta-Binomial共轭分布游戏

在这里插入图片描述

将这个游戏还原为第一个游戏，易求出分布:

$P(X_{(k)}|Y_1, Y_2, ..., Y_m)=Beta(X_{(k)}|\alpha+m_1, \beta+m_2)$

这也引出Beta-Binomial共轭：

$Beta(X|\alpha, \beta)+BinomCount(m_1, m_2) = Beta(X|\alpha+m_1, \beta+m_2)$

即:(1)先验分布为Beta分布。(2)数据分布为二项分布。则后验分布为Beta分布。

3、Dirichlet分布游戏

在这里插入图片描述
经过推导，我们可以得到 $X_{(k_1)}, X_{(k_1+k_2)})$ 的联合分布等价为:

$f(x_1, x_2, x_3) = Dir(x_1, x_2, x_3|\alpha_1, \alpha_2, \alpha_3)=\frac{\Gamma({\alpha_1+\alpha_2+\alpha_3})}{\Gamma(\alpha_1)\Gamma(\alpha_2)\Gamma(\alpha_3)}x_1^{\alpha_1-1}x_2^{\alpha_2-1}x_3^{\alpha_3-1}$

其中: $x_1 + x_2 + x_3 = 1$ . 引入 $x_3$ 是为了表达式方便， 3维狄利克雷分布参数 $\mathbf{x}$ 存在于2维单纯性上。

同样 $\alpha_1, \alpha_2, \alpha_3$ 。物理意义为伪计数，如下图所示:

在这里插入图片描述

$\alpha_1=k_1$ : 落在[0, x_1)区域的数的个数加一。
$\alpha_2=k_2$ : 落在 $[x_1+\Delta x, x_1+\Delta x + x_2)$ 区域的数的个数加一。
$\alpha_3=n-k_1-k_2+1$ : 落在 $1-x_3, 1]$ 区域的数的个数加一。

$Dirichlet(X_1, X_2, X_3 | \alpha_1, \alpha_2, \alpha_3)$ 的物理意义: 从 $U n i f o r m (0, 1)$ 中采样 $\alpha_1+\alpha_2+\alpha_3-1$ 个数，以第 $a_1$ 大数和第 $a_1+a_2$ 大的两个数为分割点将[0,1]分割为3段。前两条线段长度 $X_1, X_2$ 的联合分布。

4、Dirichlet-Multinomail共轭游戏

在这里插入图片描述

注: 原文 $p$ 的意义应该定义错了，其定义的是位置，应该是线段长度才对。

同样，将这个游戏还原为第3个游戏，易求出分布为:

$P(\overrightarrow{p}|Y_1, Y_2, ... ,Y_m)=Dirichlet(\overrightarrow{p} | \alpha_1+m_1, \alpha_2+m_2, \alpha_3+m_3)$

这引出了Dirichlet-Multinomial共轭
在这里插入图片描述

即:(1)先验为狄利克雷分布:
在这里插入图片描述
(2)数据分布为多项分布:

则后验同样为狄利克雷分布。

5、期望估计

对 $Dir(\overrightarrow{p}|\overrightarrow{\alpha})$ ，期望为:
在这里插入图片描述
这从物理意义上也很好理解， $p_i$ 表示每一段的长度， $\alpha_i$ 为落在该段的数的个数，自然是正比关系。

三、MCMC和Gibbs Sampling

该节说明了如何进行非常见分布的采样，结合代码理解:

无聊的人生事无聊

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
LDA数学八卦笔记

前言此博客是个人LDA学习总结中的一篇。用来记录LDA数学八卦的阅读笔记。文章目录一、神奇的Gamma函数一、神奇的Gamma函数Gamma函数Γ(x)\Gamma(x)Γ(x)形式复杂，起源于哥德巴赫对n!n!n!数列插值的研究。并且为了使得BetaBetaBeta函数表示简便，使得Γ(n)=(n−1)!\Gamma(n) = (n-1)!Γ(n)=(n−1)!。Gamma函数具...
复制链接

扫一扫