1. weka简介
1) weka是新西兰怀卡托大学WEKA小组用JAVA开发的机器学习/数据挖掘开源软件。
2) 相关资源链接
http://sourceforge.net/projects/weka/files/
http://www.cs.waikato.ac.nz/ml/weka/
3) 主要特点
- 集数据预处理、学习算法(分类、回归、聚类、关联分析)和评估方法等为一体的综合性数据挖掘工具
- 具有交互式可视化界面
- 提供算法学习比较环境
- 通过其接口,可实现自己的数据挖掘算法
2. 数据集(.arff文件)
数据集的呈现形式如上图所示,其表现为一个二维表,其中:
- 表格里一行称作一个实例(Instance),相当于统计学中的一个样本,或者数据库中的一条记录
- 表格里一列称作一个属性(Attribute),相当于统计学中的一个变量,或者数据库中的一个字段

本文介绍了Weka,一个由新西兰怀卡托大学开发的开源数据挖掘工具,包括其主要特点、数据集(.arff文件)的结构、数据类型、数据准备步骤以及分类过程。Weka支持数值型、标称型、字符串型和日期型数据,并提供了数据转换、模型训练和预测的功能。
最低0.47元/天 解锁文章
301

被折叠的 条评论
为什么被折叠?



