一 废话
周末完成基础知识:二项分布,多项式分布,Dirichlet 分布以及原始LDA模型的学习;Gibbs采样的基础知识在之前看过了,简而言之就是以MCMC那套思想走的。下了个GibbsLDA++的代码,内部的LDA实现还没看,暂时准备先做做字典,在使用中理解。
二 GibbsLDA++使用笔记
1.下载地址:
这里
2.编译:
Untar and unzip GibbsLDA++:
$ gunzip GibbsLDA++.tar.gz
$ tar -xf GibbsLDA++.tar
Go to the home directory of GibbsLDA++ (i.e., GibbsLDA++ directory), type:
$ make clean
$ make all
$ gunzip GibbsLDA++.tar.gz
$ tar -xf GibbsLDA++.tar
Go to the home directory of GibbsLDA++ (i.e., GibbsLDA++ directory), type:
$ make clean
$ make all
3.使用:
$ lda -est [-alpha <double>] [-beta <double>] [-ntopics <int>] [-niters <int>] [-savestep <int>] [-twords <int>] -dfile <string>