weka 学习总结

最新推荐文章于 2019-06-01 00:53:35 发布

weixin_30650039

最新推荐文章于 2019-06-01 00:53:35 发布

阅读量223

点赞数

原文链接：http://www.cnblogs.com/strawc/p/6829770.html

版权

首先分享一个学习weka的网址：http://blog.csdn.net/yangliuy/article/details/7589306

（进入园子好多年，竟然是第一次写东西，惭愧........好好学习）

1.weka介绍

我就用自己的话说说吧，weka是一个可视化的数据分析工具。对！可视化！感谢厉害的程序员们给我们带来这么多的便利，可视化的工具确实很招人喜欢呐。简单说下weka的极大功能模块：首先，weka可以对数据进行预处理，比如说离散化、标准化等等，都是一个按钮的事儿。在执行分类算法之前，weka还可以对属性进行删选，里面提供了不少筛选方法，比如主成分分析方法PCA，信息增益方法等，帮助我们筛选更有效的属性，以此提高分类准确率。同时，weka提供了分类、聚类、关联规则方法，不仅感叹好好用啊，一些经典的、基本的机器学习方法都囊括了。最后一个是对数据集整体的可视化结果，分析了每个属性的分布情况，用数值和柱形图体现。

2.weka数据格式

使用weka之前需要准备好arff（Attribute-Relation File Format）格式的数据。这里我就分享一下如何将CSV转换为arff.用Arffviewer打开你的CSV文件（注意：CSV文件必须要有属性名，且类标签的名字为“class”，我这里用excel打开本来没有属性名的csv,然后再给csv添加属性名），然后将文件另存为arff即可。这样就完成了csv到arff的转换。

结果就是这样。

2.演示

weka提供了很多机器学习算法，下面我演示的是用逻辑回归方法对Iris数据集分类。首先进入“classify”界面，“choose”选择分类算法，测试方法选择的是10-交叉验证。点击“start”开始运行分类算法。邮编区域显示的是分类结果，96%是分类准确率。

3.结束语

分享到这里，感谢浏览。

转载于:https://www.cnblogs.com/strawc/p/6829770.html

weixin_30650039

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
weka 学习总结

首先分享一个学习weka的网址：http://blog.csdn.net/yangliuy/article/details/7589306（进入园子好多年，竟然是第一次写东西，惭愧........好好学习）1.weka介绍我就用自己的话说说吧，weka是一个可视化的数据分析工具。对！可视化！感谢厉害的程序员们给我们带来这么多的便利，可视化的工具确实很招人喜欢呐。简单说下wek...
复制链接

扫一扫