- 博客(6)
- 资源 (7)
- 收藏
- 关注
转载 Rattle :基于R的数据挖掘工具(4b):探索数据
(3)相关性 Correlation选项。计算数值变量间的相关系数。 相关系数可以采用pearson,kendall,spearman三种方法。会输出相关系数矩阵。 可以把结果可视化。 这个图当中,红色表示负相关,蓝色为正相关,颜色越浅相关系数(绝
2014-11-20 21:33:49 2182
转载 Rattle :基于R的数据挖掘工具(4a):探索数据
在建立模型之前,可以通过数据探索分析(exploratory data analysis,EDA)来获得关于数据的深刻认识。数据探索可以帮助我们了解数据的形状,数据的边界(最值),数值特性和散布程度,发现有问题的数据,缺失的数据,噪声,有偏的分布。数据集就是一个故事,我们需要把这个故事有效的还原为我们能够理解的形式。 数据探索分析是数据挖掘项目的核心步骤之一,通过探索分析得到的数据变量概括和
2014-11-20 21:33:05 2038
转载 Rattle :基于R的数据挖掘工具(3):载入数据
数据 数据是进行数据挖掘工作的基础,要是没有数据,那也就没什么可挖的了。当今时代,数据的丰富超乎想象,它可以是数字,也可以是文本,图像,声音,视频等各种形式的存在。但是要把数据变成知识和信息,并不是一件简单的事。 关于数据的一般术语: 一个数据集由变量(列)的各个观测(行) 构成,其中变量可分为输入变量和输出变量,这些变量可以是数值的也可以是属性的(categoric variabl
2014-11-20 21:32:01 3763
转载 Rattle :基于R的数据挖掘工具(1):简介和安装
1.Rattle是什么 数据挖掘是当今时代的一门核心技术,提供了对大数据的描述,探索,模式的识别和预测。数据挖掘者们从统计,机器学习和计算科学中寻找各种适用的方法和工具。很多专门或通用的数据软件包被先后开发出来。 作为优秀的统计软件包,R语言也提供了强大的数据挖掘工具,但是这些工具分散在数以百计的R 包之中,而且写脚本和编程往往也会成为快速解决问题的障碍。rattle包
2014-11-20 21:30:56 2124
转载 Rattle :基于R的数据挖掘工具(2):功能概览
Rattle的界面,依次排列的是菜单,工具栏和标签栏。 1.Rattle的标签栏 一个完整的数据挖掘过程包括以下几个步骤(CRISP-DM,1996) (1) 理解问题 (2) 理解数据 (3) 准备数据 (4) 建立模型 (5) 模型评估 (6) 运用 基于这个流程,Rattle开发了一个方便的标签栏,可以便捷的
2014-11-20 21:30:05 2511 1
转载 Rattle :基于R的数据挖掘工具(1):简介和安装
原文地址http://site.douban.com/182577/widget/notes/10567212/note/241676525/ 很好的
2014-11-20 21:26:29 2269
matplotlib-1.4.0.win-amd64-py2.7.exe
2015-11-19
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人