深入浅出LDA（1）

最新推荐文章于 2023-02-17 16:16:37 发布

相国大人

最新推荐文章于 2023-02-17 16:16:37 发布

阅读量1.2k

点赞数

分类专栏： DeepLearning MachineLearning 概率图模型

本文链接：https://blog.csdn.net/github_36326955/article/details/78412062

版权

MachineLearning 同时被 3 个专栏收录

24 篇文章 4 订阅

订阅专栏

DeepLearning

22 篇文章 8 订阅

订阅专栏

概率图模型

22 篇文章 4 订阅

订阅专栏

作者：相国大人

阅读说明
Gamma函数

0. 阅读说明

与LDA紧密相关的必要且最小知识集合为博文的正文。凡是灰色框中的内容为拓展和补充内容，直接跳过并不会影响你的理解。灰色框指的是如下形式的段落：

这是一个灰色框示意段落
这部分内容为补充性内容，直接跳过并不会影响你的理解

1. $\Gamma$ 函数

1.1 $\Gamma$ 函数

$\Gamma$ 函数可以看做是阶乘在实数上的推广。

Γ (x) = \int + \infty 0 t x - 1 e - t d t = (x - 1)! (1.1)

$\Gamma(x)=\int_{0}^{+\infty}t^{x-1}e^{-t}dt=(x-1)!\tag{1.1}$
我们这里不加证明的给出性质：

Γ (x) = (x - 1) Γ (x - 1) \Rightarrow Γ ( x ) Γ ( x - 1 ) = x - 1 (1.2)

$\Gamma(x)=(x-1)\Gamma(x-1)\Rightarrow \frac{\Gamma(x)}{\Gamma(x-1)}=x-1\tag{1.2}$
想要证明上面这个式子也不难，分布积分就可以了。

整数阶乘其实就是 $\Gamma$ 函数在整数上的采样：
这里写图片描述

因此，以后只要看到 $\Gamma(\alpha)$ （ $\alpha$ 是一个定值），就把它当做定值就可以了。

1.2 用 $\Gamma$ 函数来扩充定义

我们使用 $\Gamma$ 函数，一个最重要的考量是，它可以把很多离散模型拓展到实数域上。例如，下面的这个密度函数：

f (x) = n ! ( k - 1 ) ! ( n - k ) ! x k - 1 (1 - x) n - k (1.3)

$f(x)=\frac{n!}{(k-1)!(n-k)!}x^{k-1}(1-x)^{n-k}\tag{1.3}$
其中

n $n$ ,

k $k$ 均为正整数，

x∈[0,1] $x\in [0,1]$ . 现在我们想把这个密度函数的参数扩展到实数域上，我们可以怎么做呢？要知道，如果直接把上面这个式子里面的

n $n$ 和

k $k$ 写成实数，那么实数的阶乘这个定义是有问题的。但是，如果我们明白本小节说的

Γ $\Gamma$ 函数是阶乘在实数域的推广，我们就会可以把上面的式子写成：

f (x) = Γ ( n + 1 ) Γ ( k ) Γ ( n - k + 1 ) x k - 1 (1 - x) n - k (1.4)

$f(x)=\frac{\Gamma(n+1)}{\Gamma(k)\Gamma(n-k+1)}x^{k-1}(1-x)^{n-k}\tag{1.4}$
写成这个式子后，我们发现，如果

n,k $n,k$ 仍然取正整数，这个式子就退化为原来的式子，而如果

n,k $n,k$ 取实数，那么这个式子仍然有意义。相当于原来的式子在实数域上的推广。为了好看一些，我们不妨另

α=k,β=n−k+1 $\alpha=k,\beta=n-k+1$ ，此时这个在实数域上推广的式子就可以写成：

f (x) = Γ ( α + β ) Γ ( α ) Γ ( β ) x α - 1 (1 - x) β - 1, x \in [0, 1] (1.5)

$f(x)=\frac{\Gamma(\alpha+\beta)}{\Gamma(\alpha)\Gamma(\beta)}x^{\alpha-1}(1-x)^{\beta-1},x\in [0,1]\tag{1.5}$
这个式子就是下一节我们要讲的

β $\beta$ 分布。

1.3 $\Gamma$ 函数的由来

$\Gamma$ 函数的由来
原作者：Rickjin
博主相国大人做了一些修改，精简和补充
参考文献：
《 LDA-math-神奇的Gamma函数(1)》作者：Rickjin
《 LDA-math-神奇的Gamma函数(2)》作者：Rickjin
《 LDA-math-神奇的Gamma函数(3)》作者：Rickjin

欧拉发现 $n!$ 可以用如下的一个无穷乘积表达

$[(2 1) n 1 n + 1] [(3 2) n 2 n + 2] [(4 3) n 3 n + 3] \dots = n! (1.6)$ $\Bigl[\Bigl(\frac{2}{1}\Bigr)^n\frac{1}{n+1}\Bigr] \Bigl[\Bigl(\frac{3}{2}\Bigr)^n\frac{2}{n+2}\Bigr] \Bigl[\Bigl(\frac{4}{3}\Bigr)^n\frac{3}{n+3}\Bigr] \cdots = n! \tag{1.6}$
即 $lim m \to \infty 1 \cdot 2 \cdot 3 \dots m ( 1 + n ) ( 2 + n ) \dots ( m + n ) (m + 1) n = n! (1.7)$ $\lim_{m \rightarrow \infty} \frac{1\cdot 2\cdot 3 \cdots m}{(1+n)(2+n)\cdots (m+n)}(m+1)^{n} = n!\tag{1.7}$
欧拉开始尝试从一些简单的例子开始做一些计算，看看是否有规律可循，欧拉极其擅长数学的观察与归纳。当 n=1/2的时候，带入 $(1.7)$ 式计算，整理后可以得到
$(1 2)! = 2 \cdot 4 3 \cdot 3 \cdot 4 \cdot 6 5 \cdot 5 \cdot 6 \cdot 8 7 \cdot 7 \cdot 8 \cdot 10 9 \cdot 9 \dots ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ \sqrt (1.8)$ $\Bigl(\frac{1}{2}\Bigr)! = \sqrt{\frac{2\cdot4}{3\cdot3} \cdot \frac{4\cdot6}{5\cdot5}\cdot \frac{6\cdot8}{7\cdot7} \cdot \frac{8\cdot10}{9\cdot9} \cdots}\tag{1.8}$
然而右边正好和著名的 Wallis 公式关联。Wallis 在1665年使用插值方法计算半圆曲线 $y=\sqrt {x(1−x)}$ 下的面积(也就是直径为1的半圆面积)的时候，得到关于 $\pi$ 的如下结果
$2 \cdot 4 3 \cdot 3 \cdot 4 \cdot 6 5 \cdot 5 \cdot 6 \cdot 8 7 \cdot 7 \cdot 8 \cdot 10 9 \cdot 9 \dots = π 4 (1.9)$ $\frac{2\cdot4}{3\cdot3} \cdot \frac{4\cdot6}{5\cdot5}\cdot \frac{6\cdot8}{7\cdot7} \cdot \frac{8\cdot10}{9\cdot9} \cdots = \frac{\pi}{4}\tag{1.9}$
于是，欧拉利用 Wallis 公式得到了如下一个很漂亮的结果: $\Bigl(\frac{1}{2}\Bigr)! = \frac{\sqrt{\pi}}{2}$
对数学家而言，有 $\pi$ 的地方必然有和圆相关的积分。由此欧拉猜测 $n!$ 一定可以表达为某种积分形式，于是欧拉开始尝试把 $n!$ 表达为积分形式。Wallis 公式计算的是半圆曲线 $y=\sqrt {x(1−x)}$ 下的面积，即处理积分 $\int_0^1 x^{\frac{1}{2}}(1−x)^{\frac{1}{2}}dx$ .受 Wallis 的启发，欧拉开始考虑如下的一般形式的积分
$J (e, n) = \int 10 x e (1 - x) n d x (1.10)$ $J(e,n)=\int_0^1x^e(1−x)^ndx\tag{1.10}$
此处n为正整数，e为正实数。迭代地进行分部积分方法，容易得到
$J (e, n) = 1 \cdot 2 \dots n ( e + 1 ) ( e + 2 ) \dots ( e + n + 1 ) (1.11)$ $J(e,n) = \frac{1\cdot2\cdots n}{(e+1)(e+2)\cdots(e+n+1)}\tag{1.11}$
即：
$n! = (e + 1) (e + 2) \dots (e + n + 1) \int 10 x e (1 - x) n d x (1.12)$ $n! = (e+1)(e+2)\cdots(e+n+1)\int_0^1 x^e(1-x)^ndx\tag{1.12}$
欧拉令 $e=f/g$ ，这样有：
$J (e, n) = \int 10 x f g (1 - x) n d x = g n + 1 n ! [ f + ( n + 1 ) g ] ( f + g ) ( f + 2 g ) \dots ( f + n g ) (1.13)$ $J(e,n)=\int_0^1x^{\frac{f}{g}}(1−x)^ndx=\frac{g^{n+1}n!}{[f+(n+1)g](f+g)(f+2g)\cdots(f+ng)}\tag{1.13}$
于是：
$n ! ( f + g ) ( f + 2 g ) \dots ( f + n g ) = f + ( n + 1 ) g g n + 1 \int 10 x f g (1 - x) n d x (1.14)$ $\frac{n!}{(f+g)(f+2g)\cdots(f+ng)}=\frac{f+(n+1)g}{g^{n+1}}\int_0^1x^{\frac{f}{g}}(1−x)^ndx\tag{1.14}$
欧拉看到这的时候，就比较激动了，他想，如果令 $t=1,g=0$ 左边就变成了 $n!$ ，可是右边积分变成了：
$\int 10 x 1 0 ( 1 - x ) n 0 n + 1 d x$ $\int_0^1\frac{x^\frac{1}{0}(1-x)^n}{0^{n+1}}dx$
解这个式子比较困难，于是欧拉又做了一个变换：用 $x^{\frac{g}{f+g}}$ 来代替 $x$ ,这样，上面的积分变成：
$\int 10 (1 - x g f + g) n g f + g d x (1.15)$ $\int_0^1(1-x^{\frac{g}{f+g}})^n\frac{g}{f+g}dx\tag{1.15}$
故 $(1.14)$ 式变成：
$n ! ( f + g ) ( f + 2 g ) \dots ( f + n g ) = f + ( n + 1 ) g g n + 1 \int 10 (1 - x g f + g) n g f + g d x = f + ( n + 1 ) g ( f + g ) n + 1 \int 10 ( f + g ) n + 1 g n + 1 (1 - x g f + g) n g f + g d x = f + ( n + 1 ) g ( f + g ) n + 1 \int 10 ⎛ ⎝ ⎜ ⎜ ( 1 - x g f + g ) g / ( f + g ) ⎞ ⎠ ⎟ ⎟ n d x (1.16)$ $\frac{n!}{(f+g)(f+2g)\cdots(f+ng)}=\frac{f+(n+1)g}{g^{n+1}}\int_0^1(1-x^{\frac{g}{f+g}})^n\frac{g}{f+g}dx\\=\frac{f+(n+1)g}{(f+g)^{n+1}}\int_0^1\frac{(f+g)^{n+1}}{g^{n+1}}(1-x^{\frac{g}{f+g}})^n\frac{g}{f+g}dx\\=\frac{f+(n+1)g}{(f+g)^{n+1}}\int_0^1\left(\frac{(1-x^{\frac{g}{f+g}})}{g/(f+g)}\right)^ndx\tag{1.16}$
这时，另 $f=1,g=0$ 我们可以得到：
$n! = \int 10 (1 - x 0 0) n d x (1.17)$ $n!=\int_0^1\left(\frac{1-x^0}{0}\right)^ndx\tag{1.17}$
根据洛必达法则，有
$lim z \to 0 1 - x z z = 洛必达 lim z \to 0 - x z l n x = - l n x (1.18)$ $\lim_{z\rightarrow0}\frac{1-x^z}{z}=^{洛必达}\lim_{z\rightarrow0}-x^zlnx=-lnx\tag{1.18}$
因此
$n! = \int 10 (- ln x) n d x (1.19)$ $n! = \int_0^1 (-\ln x)^ndx\tag{1.19}$
如果令 $x=e^{-t}$ 上式就变成了
$n! = \int + \infty 0 t n e - t d t (1.20)$ $n!=\int_{0}^{+\infty}t^{n}e^{-t}dt\tag{1.20}$
这样一来，整数的阶乘被写成了积分的形式，所以我们可以将整数的阶乘推广到实数域里，即定义一个在实数域的阶乘函数, $\Gamma$ 函数。
欧拉早期定义的 $\Gamma$ 函数是：
$Γ (x) = \int \infty 0 t x e - t d t = x!$ $\Gamma(x) = \int_0^{\infty} t^{x}e^{-t}dt=x!$ 就是上面的阶乘积分式子。但是后来欧拉修改了定义，将 $\Gamma$ 函数定义为：
$Γ (x) = \int + \infty 0 t x - 1 e - t d t = (x - 1)! (1.21)$ $\Gamma(x)=\int_{0}^{+\infty}t^{x-1}e^{-t}dt=(x-1)!\tag{1.21}$
之所以这样做，有数学家猜测，一个可能的原因是欧拉研究了如下积分：
$B (m, n) = \int 10 x m - 1 (1 - x) n - 1 d x (1.22)$ $B(m,n)=\int_0^1x^{m−1}(1−x)^{n−1}dx\tag{1.22}$ 这个函数现在称为Beta 函数。如果Gamma 函数的定义选取满足 $\Gamma(n)=(n−1)!$ , 那么有
$B (m, n) = Γ ( m ) Γ ( n ) Γ ( m + n ) (1.23)$ $B(m,n)=\frac{\Gamma(m)\Gamma(n)}{\Gamma(m+n)}\tag{1.23}$
非常漂亮的对称形式。可是如果选取 $\Gamma(n)=n!$ 的定义，令
$E (m, n) = \int 10 x m (1 - x) n d x$ $E(m,n)=\int^1_0x^m(1−x)^ndx$
则有
$E (m, n) = Γ ( m ) Γ ( n ) Γ ( m + n + 1 )$ $E(m,n)=\frac{\Gamma(m)\Gamma(n)}{\Gamma(m+n+1)}$
这个形式显然不如 $B(m,n)$ 优美，而数学家总是很在乎数学公式的美感的。

1.4 $\Gamma$ 函数的性质

$\Gamma$ 函数的性质
作者：相国大人
1. 与欧拉常数的关系
我们把调和级数与自然对数差值的极限叫做欧拉常数 $\gamma$ ：
$γ = lim n \to \infty (\sum k = 1 n 1 k - ln (n)) (1.24)$ $\gamma=\lim_{n\rightarrow \infty}\left(\sum_{k=1}^n\frac{1}{k}-\ln(n)\right)\tag{1.24}$
其中： $γ = - d Γ ( x ) d x | x = 1 (1.25)$ $\gamma = -\frac{d\Gamma(x)}{dx}|_{x=1}\tag{1.25}$
为了证明上面这个式子，我们需要做两件事：
第一：我们需要知道 $d n Γ ( x ) d x n = \int \infty 0 t x - 1 e - t (ln t) n d t (1.26)$ $\frac{d^n\Gamma(x)}{dx^n}=\int_0^\infty t^{x-1}e^{-t}\left(\ln t\right)^n dt\tag{1.26}$
得到这个式子并不难：
$∵ Γ (x) = \int + \infty 0 t x - 1 e - t d t = (x - 1)! (1.27)$ $\because \Gamma(x)=\int_{0}^{+\infty}t^{x-1}e^{-t}dt=(x-1)!\tag{1.27}$
$∴ d Γ ( x ) d x = \int \infty 0 d t x - 1 d x e - t d t = \int \infty 0 t x - 1 (ln t) e - t d t (1.26)$ $\therefore \frac{d\Gamma(x)}{dx}=\int_0^\infty\frac{dt^{x-1}}{dx}e^{-t} dt\\=\int_0^\infty t^{x-1}\left(\ln t\right)e^{-t}dt\tag{1.26}$
同理，以此类推可以得到任意阶导数 $(1.26)$
第二：我们需要知道 $d Γ ( x ) d x | x = 1 = \int \infty 0 e - x ln x d x (1.27)$ $\frac{d\Gamma(x)}{dx}|_{x=1}=\int_0^\infty e^{-x}\ln xdx\tag{1.27}$ 令 $(1.26)$ 中的 $x=1$ 即可得到此式。
这样，我们只需要证明：
$γ = - \int \infty 0 e - x ln x d x (1.28)$ $\gamma=-\int_0^\infty e^{-x}\ln xdx\tag{1.28}$ 即可，下面是具体的证明过程。
在证明之前，我们需要知道几个常见的公式：
$x n - 1 = (x - 1) (x n - 1 + x n - 2 + \dots + x + 1) (1.29)$ $x^n-1=(x-1)(x^{n-1}+x^{n-2}+\cdots+x+1)\tag{1.29}$
$\int 10 x k - 1 d x = 1 k (1.30)$ $\int_0^1x^{k-1}dx=\frac{1}{k}\tag{1.30}$
$\int n 1 1 x d x = ln n (1.31)$ $\int_1^{n}\frac{1}{x}dx=\ln n\tag{1.31}$

证明：
由 $(1.24,1.30,1.31)$ 立即可得

$γ = lim n \to \infty (\sum k = 1 n \int 10 x k - 1 d x - \int n 1 1 x d x) = lim n \to \infty (\int 10 \sum k = 1 n x k - 1 d x - \int n 1 1 x d x) (1.32)$ $\gamma=\lim_{n\rightarrow\infty}\left(\sum_{k=1}^{n}\int_0^1x^{k-1}dx-\int_1^n \frac{1}{x}dx\right)\\=\lim_{n\rightarrow\infty}\left(\int_0^1\sum_{k=1}^{n}x^{k-1}dx-\int_1^n \frac{1}{x}dx\right)\tag{1.32}$ 将 $(1.29)$ 代入 $(1.32)$ 立即得到：
$(1.32) = lim n \to \infty (\int 10 1 - x n + 1 1 - x d x - \int n 1 1 x d x) = 1 - x \to t lim n \to \infty (\int 10 1 - ( 1 - t ) n + 1 t d t - \int n 1 1 x d x) = t \to x n + 1 lim n \to \infty ⎛ ⎝ ⎜ ⎜ \int n 0 1 - ( 1 - x n + 1 ) n + 1 x d x - \int n 1 1 x d x ⎞ ⎠ ⎟ ⎟ = lim n \to \infty ⎛ ⎝ ⎜ ⎜ \int 10 1 - ( 1 - x n + 1 ) n + 1 x d x + \int n 1 1 - ( 1 - x n + 1 ) n + 1 x d x - \int n 1 1 x d x ⎞ ⎠ ⎟ ⎟ = lim n \to \infty ⎛ ⎝ ⎜ ⎜ \int 10 1 - ( 1 - x n + 1 ) n + 1 x d x - \int n 1 ( 1 - x n + 1 ) n + 1 x d x ⎞ ⎠ ⎟ ⎟ (1.33)$ $(1.32)=\lim_{n\rightarrow\infty}\left(\int_0^1\frac{1-x^{n+1}}{1-x}dx-\int_1^n \frac{1}{x}dx\right)\\=^{1-x\rightarrow t}\lim_{n\rightarrow\infty}\left(\int_0^1\frac{1-(1-t)^{n+1}}{t}dt-\int_1^n \frac{1}{x}dx\right)\\=^{t\rightarrow \frac{x}{n+1}}\lim_{n\rightarrow\infty}\left(\int_0^{n}\frac{1-(1-\frac{x}{n+1})^{n+1}}{x}dx-\int_1^n \frac{1}{x}dx\right)\\=\lim_{n\rightarrow\infty}\left(\int_0^{1}\frac{1-(1-\frac{x}{n+1})^{n+1}}{x}dx+\int_1^{n}\frac{1-(1-\frac{x}{n+1})^{n+1}}{x}dx-\int_1^n \frac{1}{x}dx\right)\\=\lim_{n\rightarrow\infty}\left(\int_0^{1}\frac{1-(1-\frac{x}{n+1})^{n+1}}{x}dx-\int_1^n \frac{(1-\frac{x}{n+1})^{n+1}}{x}dx\right)\tag{1.33}$
把上面的式子极限放到积分里面（之所以可以这样做是因为两部分都有极限）得到:
$(1.32) = \int 10 1 - e - x x d x - \int \infty 1 e - x x d x = - (\int 10 e - x ln x d x + \int \infty 1 e - x ln x d x) + (1 - e - x) ln x ∣ ∣ 10 - (e - x) ln x ∣ ∣ + \infty 1 (1.34)$ $(1.32)=\int_0^1\frac{1-e^{-x}}{x}dx-\int_1^\infty \frac{e^{-x}}{x}dx\\=-\left(\int_0^1e^{-x}\ln xdx+\int_1^\infty e^{-x}\ln x dx\right)+ \left. (1-e^{-x})\ln x \right|_0^1-\left. (e^{-x})\ln x \right|_1^{+\infty}\tag{1.34}$
对于式子 $(1.34)$ ，后面两项均为0:
$lim x \to 0 (1 - e - x) ln x = lim x \to 0 ln x 1 1 - e - x = 洛必达 lim x \to 0 1 x - e - x ( 1 - e - x ) 2 = lim x \to 0 2 ( 1 - e - x e - x ) - e - x + x e - x = lim x \to 0 2 ( 1 - e - x ) x - 1 = 0$ $\lim_{x\rightarrow 0} (1-e^{-x})\ln x=\lim_{x\rightarrow 0}\frac{\ln x}{\frac{1}{1-e^{-x}}}\\=^{洛必达}\lim_{x\rightarrow 0}\frac{\frac{1}{x}}{\frac{-e^{-x}}{(1-e^{-x})^2}}\\=\lim_{x\rightarrow 0}\frac{2(1-e^{-x}e^{-x})}{-e^{-x}+xe^{-x}}\\=\lim_{x\rightarrow 0}\frac{2(1-e^{-x})}{x-1}=0$
$lim x \to + \infty (e - x) ln x = lim x \to + \infty ln x e x = 洛必达 lim x \to + \infty 1 x e x = 0$ $\lim_{x\rightarrow +\infty}(e^{-x})\ln x=\lim_{x\rightarrow +\infty}\frac{\ln x}{e^x}\\=^{洛必达}\lim_{x\rightarrow +\infty}\frac{1}{xe^x}=0$
因此有：
$γ = - \int \infty 0 e - x ln x d x = - d Γ ( x ) d x | x = 1$ $\gamma=-\int_0^\infty e^{-x}\ln xdx= -\frac{d\Gamma(x)}{dx}|_{x=1}$