weka3.8-README(二)

4. 从命令行使用Weka  

如果要从标准命令行界面使用Weka(例如Linux下的bash):

a)将WEKAINSTALL设置为包含此README的目录。
b)将$ WEKAINSTALL / weka.jar添加到CLASSPATH环境变量中。
c)在Web浏览器中为$ WEKAINSTALL / doc / packages.html添加书签。

或者,您可以尝试使用上面讨论的GUI选择器中提供的SimpleCLI用户界面。
 在下文中,文件名假定使用带有环境变量的unix命令行。对于其他命令行(包括SimpleCLI),您应该将weka.jar所在目录的名称替换为$ WEKAINSTALL。如果您的平台使用除/作为路径分隔符之外的其他字符,也可以进行相应的替换。

- 分类器

尝试:

java weka.classifiers.trees.J48 -t $WEKAINSTALL/data/iris.arff

这将打印出虹膜数据集的决策树分类器和其性能的十倍交叉验证估计。如果您未将任何选项传递给分类器,WEKA将列出所有可用选项。尝试:

java weka.classifiers.trees.J48

这些选项分为适用于WEKA中大多数分类方案的“常规”选项,以及仅适用于当前方案的特定于方案的选项---在本例中为J48。 WEKA具有所有分类方法的通用接口。任何实现分类器的类都可以使用与上面使用的J48相同的方式。 WEKA知道如果类在weka.classifiers中扩展Classifier类,则实现分类器。 weka.classifiers中的几乎所有类都属于这一类。尝试,例如:

java weka.classifiers.bayes.NaiveBayes -t $WEKAINSTALL/data/labor.arff

以下是weka.classifiers中当前实现的一些分类器的列表:

a)分类预测的分类器:

weka.classifiers.lazy.IBk:k-最近邻算法

weka.classifiers.trees.J48:C4.5决策树

weka.classifiers.rules.PART:规则学习者

weka.classifiers.bayes.NaiveBayes :带/不带内核的朴素贝叶斯

weka.classifiers.rules.OneR:Holte的OneR

weka.classifiers.functions.SMO:支持向量机

weka.classifiers.functions.Logistic:logistic回归

weka.classifiers.meta.AdaBoostM1:AdaBoost (迭代算法,其核心思想是针对同一个训练集训练不同的分类器(弱分类器),然后把这些弱分类器集合起来,构成一个更强的最终分类器(强分类器)) 

weka.classifiers.meta.LogitBoost:logit boost

weka.classifiers.trees.DecisionStump:decision stumps单层决策树(for boosting)等。

 b)数值预测的分类器:

weka.classifiers.functions.LinearRegression:线性回归

weka.classifiers.trees.M5P:模型树

weka.classifiers.rules.M5Rules:模型规则

weka.classifiers.lazy.IBk:k-最近邻算法

weka.classifiers.lazy.LWL:局部加权学习

 

- 关联规则

除了分类方案,WEKA还有其他一些有用的东西。例如,可以使用Apriori算法提取关联规则。尝试:

java weka.associations.Apriori -t $WEKAINSTALL/data/weather.nominal.arff

 

- 过滤器

  还有许多工具可以让您操作数据集。这些工具在WEKA中称为过滤器,可以在weka.filters中找到。
weka.filters.unsupervised.attribute.Discretize:离散数字数据

weka.filters.unsupervised.attribute.Remove:删除/选择属性等。

尝试:

java weka.filters.supervised.attribute.Discretize -i
  $WEKAINSTALL/data/iris.arff -c last

 

5. 数据库访问

        就数据库连接而言,您应该能够使用任何带有Java JDBC驱动程序的数据库。使用访问数据库的类(例如Explorer)时,您可能希望创建一个属性文件,该文件指定要使用的JDBC驱动程序,在何处查找数据库,以及指定数据类型的映射。此文件应驻留在您的主目录或当前目录中,并称为“DatabaseUtils.props”。在weka / experiment中提供了一个示例(您需要扩展weka.jar以便能够查看此文件)。请注意,除非主目录中的DatabaseUtils.props文件或当前目录(按此顺序)中的设置覆盖了此文件中的设置,否则将使用此设置中的设置。
 还有几个可用的公共数据库的示例DatabaseUtils.props文件(也在weka / experiment中):

* HSQLDB: DatabaseUtils.props.hsql
* MS SQL Server 2000: DatabaseUtils.props.mssqlserver
* MS SQL Server 2005 Express Edition: DatabaseUtils.props.mssqlserver2005
* MySQL: DatabaseUtils.props.mysql
* ODBC: DatabaseUtils.props.odbc
* Oracle: DatabaseUtils.props.oracle
* PostgreSQL: DatabaseUtils.props.postgresql

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值