参考: http://www.cnblogs.com/pinard/p/6908150.html http://blog.csdn.net/TiffanyRabbit/article/details/76445909 原理:使用LDA进行模型训练,得到每个文档的主题分布,即每个文档包含的每个主题的权重,此权重即可作为特征ÿ