Mallet 是专门用于机器学习方面的软件包,此软件包基于 java 。通过 mallet 工具,可以进行自然语言处理,文本分类,主题建模。文本聚类,信息抽取等。下面是从如何配 置 mallet 环境到如何使用 mallet 进行介绍。
一. 实验环境配置
1. 下载 并安装 JDK ,并正确设置环境变量
需设置三个环境变量:
² JAVA_HOME : 该环境变量的值就是 Java 所在的目录,
例如 C:/Program Files/Java/jdk1.6.0_10
² PATH : 指定一个路径列表,用于搜索可执行文件。
该环境变量值为: %JAVA_HOME%/bin
² CLASSPATH : 指定一个路径列表,是用于搜索 Java 编译或者运行时需要用到的类。该环境变量的值为: %JAVA_HOME%/lib/tools.jar ; %JAVA_HOME%/lib/dt.jar
² 运行 à cmd
² 分别 输入 javac 和 java ,没有出错则表示配置成功。
2. 下载 apache-ant ,不需安装,只需正确设置环境变量。
apache-ant 是一个基于 Java 的编译工具。
² 下载 http://ant.apache.org/bindownload.cgi ,解压 放到你要的目录
² 配置
ANT_HOME :设置为 apache-ant 的解压目录, 例如: C:/server/apache-ant-1.8.0
classpath : %ANT_HOME%/lib