更多内容请访问我的个人博客www.tenliu.top
简介
LDA是一种主题模型,它基于这样的思想:人写文章可以理解成这样的过程,再写一篇文档之前,先有这篇文档的主题分布(文档-主题),每一个主题也有词分布(主题-词)
知识储备
我们先从一些基础概念讲起
Gamma函数
先看公式
Γ(x)=∫∞0tx−1e−tdt
其实就是阶乘运算扩展到了实数集上而已。
它的一些性质:
Γ(x+1)=xΓ(x)
Gamma(n)=(n−1)!
一些分布
Beta分布定义:
其中 B(α,β) 称为Beta函数
B(α,β)=∫