C++JAVA程序调用weka聚类算法的方法

weka(http://www.cs.waikato.ac.nz/~ml/weka/)是一个功能强大的数据挖掘开源工具包,但目前网上很难找到如果在程序里面调用weka中算法的例子。特别是如果程序是用C++编写的话,就更麻烦。  

前几天找了Java熟悉的师弟,把weka的源代码相关部分看了 一下,用java写了一个程序实现了在Java里面对weka的EM算法的调用。最后我把程序根据不同算法封装了一下~可以直接命令行执行。这样即使是 C++程序也可以调用weka里面的算法。在C++中用 system()语句实现命令行调用。

目前我只做了EM算法跟X-means算法的封装,感觉这两个算 法比较实用。对于分类算法,封装起来好麻烦,目前没什么时间,就暂且不弄了。如果有哪位做了分类算法方面的封装的,麻烦发现email(e- mail:jpshen2008#gmail.com)给我,大家交流下。

附件里是封装好的这两个算法的使用(注意:由于上传文件的大大小 限制在2m,故请大家自行到weka网站上(http://www.cs.waikato.ac.nz/~ml/weka/)下载 weka程序,并且安装weka后可以在他们安装目录下找weka.jar,请把weka.jar放在lib目录下即可)。

 

XMEANS算法关键代码:

weka.clusterers.XMeans clusterer = new weka.clusterers.XMeans();
clusterer.setMaxIterations(Integer.parseInt(options[1]));
clusterer.setMinNumClusters(Integer.parseInt(options[2]));
clusterer.setMaxNumClusters(Integer.parseInt(options[3]));
Instances inst = getArffData(personName);//personName:is the input data
//build the model using dataSet:inst
clusterer.buildClusterer(inst);
//evaluate the input data
System.out.println(clusterer.toString());
ClusterEvaluation eval = new ClusterEvaluation();
eval.setClusterer(clusterer);
eval.evaluateClusterer(inst);
EM算法关键代码:
weka.clusterers.EM clusterer = new weka.clusterers.EM();
clusterer.setMaxIterations(Integer.parseInt(options[1]));
clusterer.setNumClusters(Integer.parseInt(options[2]));
Instances inst = getArffData(personName);
clusterer.buildClusterer(inst);
System.out.println(clusterer.toString());
ClusterEvaluation eval = new ClusterEvaluation();
eval.setClusterer(clusterer);
eval.evaluateClusterer(inst);
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值