【数据挖掘软件 weka】第一部分 开始使用weka


一、weka简介

WEKA作为一个公开的数据挖掘工作平台,集合了大量能承担数据挖掘任务的机器学习算法,包括对数据进行预处理,分类,回归、聚类、关联规则以及在新的交互式界面上的可视化。

如果想自己实现数据挖掘算法的话,可以参考weka的接口文档。在weka中集成自己的算法甚至借鉴它的方法自己实现可视化工具并不是件很困难的事情。


二、数据集的导入及编辑

打开weka软件后,点击Explorer,进入主界面,点击openfile,可打开自己的数据集或软件自带的数据集(数据集位于软件安装位置的data文件夹中)。
打开Explorer进入主界面
weka存储数据的格式是ARFF(Attribute-Relation File Format)文件,是一种ASCII文本文件。此外,weka还提供了对CSV文件的支持,而这种格式是被很多其他软件所支持的,weka还提供了通过JDBC访问数据库的功能。

  • 将文件转为CSV文件
    可以通过EXCEL将文件转为CSV格式:打开文件另存为,可见EXCEL支持CSV的存储格式。
    EXCEL的存储格式
    也可以通过matlab将数据存储为CSV格式
%% table方式存储

%需要保存的矩阵
A=[1 2 3;4 5 6; 7 8 9];
%行名称
m=['m1'
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值