LDA
贝叶斯概率模型:先验概率+观察数据 -> 后验概率
LDA以其灵活地对主题的分布进行概率估计,被广泛应用于主题模型抽取之中。这里仅列举概念和读过的资料,具体内容不赘述。多种语言中已经实现过此算法。总之,这是一个好用但不好吃透的算法,最后得到的也只是近似最优解。
涉及到的知识
- 多项分布
- 狄利克雷函数
- 马尔科夫链:平稳转移矩阵,收敛
- 吉布斯采样
Reference
- Lda数学八卦-靳志辉
- 通俗理解 Lda 主题模型 2015
- Parameter Estimation for Text Analysis - Heinrich, Gregor(详细讲解了 LDA+Gibbs sampling 抽取文本主题模型的过程)