- 博客(6)
- 资源 (7)
- 收藏
- 关注
转载 Rattle :基于R的数据挖掘工具(4b):探索数据
(3)相关性Correlation选项。计算数值变量间的相关系数。 相关系数可以采用pearson,kendall,spearman三种方法。会输出相关系数矩阵。可以把结果可视化。 这个图当中,红色表示负相关,蓝色为正相关,颜色越浅相关系数(绝
2014-11-20 21:33:49 2134
转载 Rattle :基于R的数据挖掘工具(4a):探索数据
在建立模型之前,可以通过数据探索分析(exploratory data analysis,EDA)来获得关于数据的深刻认识。数据探索可以帮助我们了解数据的形状,数据的边界(最值),数值特性和散布程度,发现有问题的数据,缺失的数据,噪声,有偏的分布。数据集就是一个故事,我们需要把这个故事有效的还原为我们能够理解的形式。数据探索分析是数据挖掘项目的核心步骤之一,通过探索分析得到的数据变量概括和
2014-11-20 21:33:05 2011
转载 Rattle :基于R的数据挖掘工具(3):载入数据
数据数据是进行数据挖掘工作的基础,要是没有数据,那也就没什么可挖的了。当今时代,数据的丰富超乎想象,它可以是数字,也可以是文本,图像,声音,视频等各种形式的存在。但是要把数据变成知识和信息,并不是一件简单的事。关于数据的一般术语:一个数据集由变量(列)的各个观测(行) 构成,其中变量可分为输入变量和输出变量,这些变量可以是数值的也可以是属性的(categoric variabl
2014-11-20 21:32:01 3710
转载 Rattle :基于R的数据挖掘工具(1):简介和安装
1.Rattle是什么 数据挖掘是当今时代的一门核心技术,提供了对大数据的描述,探索,模式的识别和预测。数据挖掘者们从统计,机器学习和计算科学中寻找各种适用的方法和工具。很多专门或通用的数据软件包被先后开发出来。 作为优秀的统计软件包,R语言也提供了强大的数据挖掘工具,但是这些工具分散在数以百计的R 包之中,而且写脚本和编程往往也会成为快速解决问题的障碍。rattle包
2014-11-20 21:30:56 2092
转载 Rattle :基于R的数据挖掘工具(2):功能概览
Rattle的界面,依次排列的是菜单,工具栏和标签栏。 1.Rattle的标签栏一个完整的数据挖掘过程包括以下几个步骤(CRISP-DM,1996)(1) 理解问题(2) 理解数据(3) 准备数据(4) 建立模型(5) 模型评估(6) 运用基于这个流程,Rattle开发了一个方便的标签栏,可以便捷的
2014-11-20 21:30:05 2450 1
转载 Rattle :基于R的数据挖掘工具(1):简介和安装
原文地址http://site.douban.com/182577/widget/notes/10567212/note/241676525/很好的
2014-11-20 21:26:29 2218
matplotlib-1.4.0.win-amd64-py2.7.exe
2015-11-19
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人