Rattle :基于R的数据挖掘工具(2):功能概览

Rattle的界面,依次排列的是菜单,工具栏和标签栏。
 

1.Rattle的标签栏

一个完整的数据挖掘过程包括以下几个步骤(CRISP-DM,1996)
(1) 理解问题
(2) 理解数据
(3) 准备数据
(4) 建立模型
(5) 模型评估
(6) 运用

基于这个流程,Rattle开发了一个方便的标签栏,可以便捷的完成操作。

这个标签栏从左到右依次排列,各自完成数据挖掘的一个相关步骤。

Data:选择数据源,输入数据。
Explore:执行数据探索,理解数据分布。
Test:提供各种统计检验。
Transform:变换数据的形式。
Cluster:数据聚类,包括系统聚类,k-均值聚类,和双聚类(biclustering)。
Associate:关联规则方法。
Model:内容最丰富的一个标签。包括多种方法:决策树,支持向量机,线性模型,
神经网络,随机森林,提升(Boost)。
 


Evaluate:模型评估,它会提供一个实际结果和预测结果进行比较的误差矩阵。
Log:数据挖掘过程的纪录。它可以给出所进行的Rattle操作的R代码,利用这个标签,可以学习R的数据挖掘过程,也可以把纪录以文本形式输出,在R 平台中实现R和Rattle的交互。

2.Rattle的工具栏和菜单
 Rattle工具栏上最主要的一个按钮是Execute按钮(执行)。所有的操作都要点击Execute来完成(对应的快捷键是F2)。

Report按钮,可以完成当前操作的格式化报告(以开放的标准ODT格式)。
Export按钮,可以输出来自Rattle的各种对象,特别的,完成Moel标签的相关操作后,它会以PMML格式保存当前模型。

Rattle工具栏和标签栏完成的大部分工作,使用菜单也可以完成。菜单很平凡,特别要指出的一点是,setting菜单中的Use Cario Graphics Device这一项要选中,这样图形才会以Rattle图形设备的形式输出,否则,会作为R图形输出。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值