mallet是LDA主题模型的一款开源工具,普通的安装(在win7下)直接上官网教程即可,见链接:Getting Started with Topic Modeling and MALLET
为了方便集成,我选择在eclipse下搭建mallet,从官网下载:mallet下载主页 。
解压生成文件夹mallet,直接在eclipse下导入该文件作为工程。
然后在src/cc/mallet/example/下打开TopicModel.java文件,修改filereader文件目标路径(见图),指向你已经分好词的文件。修改后运行即可。