LDA全称是Latent Dirichlet Allocation。关于LDA的理论知识,可以参见如下参考维基百科。这里具体讲解一下LDA的源码分析(matlab)
代码原作者:Daichi Mochihashi
源码下载地址:http://download.csdn.net/detail/nuptboyzhb/5305145
一.LDA源码在matlab环境下的执行
1.环境配置
将matlab的工作目录切换到代码所在目录
2.调用主函数
>> [alpha,beta] =ldamain(‘train’,20);%训练数据文件train 分类数20
二.训练数据train的数据格式
如:
<feature_id>:<count> 特征的标号:对应的个数
对于文档而言,特征id表征的是某个单词,数目则表示单词出现的次数
train中的每一行表示一个文档,如下:
1:1 2:4 5:2
1:2 3:3 5:1 6:1 7:1
2:4 5:1 7:1
注意:LDA中train的数据格式与SVM中的差异,在SVM中,训练数据的格式如下:
与svm
代码原作者:Daichi Mochihashi
源码下载地址:http://download.csdn.net/detail/nuptboyzhb/5305145
一.LDA源码在matlab环境下的执行
1.环境配置
将matlab的工作目录切换到代码所在目录
2.调用主函数
>> [alpha,beta] =ldamain(‘train’,20);%训练数据文件train 分类数20
二.训练数据train的数据格式
如:
<feature_id>:<count> 特征的标号:对应的个数
对于文档而言,特征id表征的是某个单词,数目则表示单词出现的次数
train中的每一行表示一个文档,如下:
1:1 2:4 5:2
1:2 3:3 5:1 6:1 7:1
2:4 5:1 7:1
注意:LDA中train的数据格式与SVM中的差异,在SVM中,训练数据的格式如下:
与svm