Weka(二)—Classification(糖尿病数据集&Cross-validation交叉验证&meta-classifier(CVParameter)&Weka Knowledge Flow)

diabetes prediction dataset

https://archive.ics.uci.edu/ml/datasets/Early+stage+diabetes+risk+prediction+dataset.

 

在weka中打开

 

How to use Weka to run a classifier(a classification model)

 

Choose classifier

这个就是C4.5决策树算法的实现(weka成为J48)

这里 -C 0.25 是Confidence Factor=0.25

-M 2 是minNumObj=2,即 the minimum number of instances per leaf

 

可以在这change options

 

Classifier evalution

for several classifier evaluation method, see 

 

可以看到这里有几个选项可以选择

 

k-fold Cross-validation in Weka

 

 

meta-classifier

Weka provides a set of meta-classifiers that combine tools with existing classifiers

 

CVParameterSelection

采用交叉验证的方法,对参数进行优化选择

如果要使用J48 algorithm using CVParameterSelection

就要先选择CVParameterSelection,然后在CVParameterSelection的参数选择的classifier中选择J48 algorithm

执行结果中可以看到classifier选择的C,也就是最有的C值

即C的值0.2是最优的

 

 

 

 

Weka Knowledge Flow


 

  • 0
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值