R Rattle工具使用介绍
JOE-1992
这个作者很懒,什么都没留下…
展开
-
Rattle :基于R的数据挖掘工具(3):载入数据
数据数据是进行数据挖掘工作的基础,要是没有数据,那也就没什么可挖的了。当今时代,数据的丰富超乎想象,它可以是数字,也可以是文本,图像,声音,视频等各种形式的存在。但是要把数据变成知识和信息,并不是一件简单的事。关于数据的一般术语:一个数据集由变量(列)的各个观测(行) 构成,其中变量可分为输入变量和输出变量,这些变量可以是数值的也可以是属性的(categoric variabl转载 2014-11-20 21:32:01 · 3710 阅读 · 0 评论 -
Rattle :基于R的数据挖掘工具(1):简介和安装
原文地址http://site.douban.com/182577/widget/notes/10567212/note/241676525/很好的转载 2014-11-20 21:26:29 · 2218 阅读 · 0 评论 -
Rattle :基于R的数据挖掘工具(2):功能概览
Rattle的界面,依次排列的是菜单,工具栏和标签栏。 1.Rattle的标签栏一个完整的数据挖掘过程包括以下几个步骤(CRISP-DM,1996)(1) 理解问题(2) 理解数据(3) 准备数据(4) 建立模型(5) 模型评估(6) 运用基于这个流程,Rattle开发了一个方便的标签栏,可以便捷的转载 2014-11-20 21:30:05 · 2450 阅读 · 1 评论 -
Rattle :基于R的数据挖掘工具(1):简介和安装
1.Rattle是什么 数据挖掘是当今时代的一门核心技术,提供了对大数据的描述,探索,模式的识别和预测。数据挖掘者们从统计,机器学习和计算科学中寻找各种适用的方法和工具。很多专门或通用的数据软件包被先后开发出来。 作为优秀的统计软件包,R语言也提供了强大的数据挖掘工具,但是这些工具分散在数以百计的R 包之中,而且写脚本和编程往往也会成为快速解决问题的障碍。rattle包转载 2014-11-20 21:30:56 · 2092 阅读 · 0 评论 -
Rattle :基于R的数据挖掘工具(4a):探索数据
在建立模型之前,可以通过数据探索分析(exploratory data analysis,EDA)来获得关于数据的深刻认识。数据探索可以帮助我们了解数据的形状,数据的边界(最值),数值特性和散布程度,发现有问题的数据,缺失的数据,噪声,有偏的分布。数据集就是一个故事,我们需要把这个故事有效的还原为我们能够理解的形式。数据探索分析是数据挖掘项目的核心步骤之一,通过探索分析得到的数据变量概括和转载 2014-11-20 21:33:05 · 2011 阅读 · 0 评论 -
Rattle :基于R的数据挖掘工具(4b):探索数据
(3)相关性Correlation选项。计算数值变量间的相关系数。 相关系数可以采用pearson,kendall,spearman三种方法。会输出相关系数矩阵。可以把结果可视化。 这个图当中,红色表示负相关,蓝色为正相关,颜色越浅相关系数(绝转载 2014-11-20 21:33:49 · 2134 阅读 · 0 评论