由于最近在学习相关能容,所以将资料共享出来,直接戳名字下载。(这个文章会实时更新,所以如果下次点不开。。。可能正在审核吧)
1. LDA数学八卦
简介:个人认为是非常适合初学者的读物,用原文的话来说就是“初衷就是写给工业界的工程师们看的”,从最基础的Gamma函数说到Beta和Dirichlet分布,从Gibbs Sampling说到LDA model的training和inference,用魔鬼猜数字的故事贯穿全文生动形象地描述了每一个细节。
2. Parameter estimation for text analysis
简介:Gregor Heinrich介绍了几种的文本模型参数估计方法,最大似然估计(ML)、最大后验概率估计(MAP)、贝叶斯估计,当然主要还是介绍Latent Dirichlet Allocation,和LDA数学八卦配合起来看是最好的,里面有比较详细的LDA下Gibbs Sampling的算法流程。
3. 通俗理解LDA主题模型
简介:看过LDA数学八卦后,你会发现这里面有不少东西是很相似的,包括图片,作为中文读物,我觉得还是不错的,但是可能因为排版问题,里面好像丢失了不少符号和图片,不过作为补充读物还是不错的,也用详实的例子描述了LDA模型的运作。
如果有什么好的文献可以共享出来,大家一起讨论!
2014年11月24日更新,未完待续。。。