最近要使用LDA提取主题,mallet是基于Java的机器学习包,可以用于自然语言处理、文本分类、主题建模等。
1、配置Java环境
下载相应版本的jdk,例如jdk1.7.0_11。
解压之后放置在d:\jdk1.7.0_11。
设置JAVA_HOME=d:\jdk1.7.0_11
PATH=.;%JAVA_HOME%\bin
CLASSPATH=.;%JAVA_HOME%/lib/tools.jar;%JAVA_HOME%/lib/dt.jar
2、配置ant环境
下载ant,解压到d:下
设置ANT_HOME=d:\apache-ant-1.9.4
添加CLASSPATH=%ANT_HOME%\lib
添加PATH=%ANT_HOME%\bin
测试:cmd下输入ant,出现下面的结果表示成功