一、weka简介
WEKA作为一个公开的数据挖掘工作平台,集合了大量能承担数据挖掘任务的机器学习算法,包括对数据进行预处理,分类,回归、聚类、关联规则以及在新的交互式界面上的可视化。
如果想自己实现数据挖掘算法的话,可以参考weka的接口文档。在weka中集成自己的算法甚至借鉴它的方法自己实现可视化工具并不是件很困难的事情。
二、数据集的导入及编辑
打开weka软件后,点击Explorer,进入主界面,点击openfile,可打开自己的数据集或软件自带的数据集(数据集位于软件安装位置的data文件夹中)。
weka存储数据的格式是ARFF(Attribute-Relation File Format)文件,是一种ASCII文本文件。此外,weka还提供了对CSV文件的支持,而这种格式是被很多其他软件所支持的,weka还提供了通过JDBC访问数据库的功能。
- 将文件转为CSV文件
可以通过EXCEL将文件转为CSV格式:打开文件另存为,可见EXCEL支持CSV的存储格式。
也可以通过matlab将数据存储为CSV格式
%% table方式存储
%需要保存的矩阵
A=[1 2 3;4 5 6; 7 8 9];
%行名称
m=['m1'