R语言与数据挖掘
文章平均质量分 59
基本语法、画图、案例、以及实现经典的数据挖掘算法
Gavin姓陈
管理科学、数据科学、计算机科学。
展开
-
R语言语法及建模合集
点击下列超链接可进入博客:一、语法篇:R语言常用包分类R语言数据导入导出总结R语言数据探索功能总结R语言中的离群点检测方法R语言中的向量使用合集R语言中的因子类型R语言中的对象以及它的模式与属性R语言中的列表和数据框R语言中的控制流函数R语言中的函数定义二、画图篇:三、统计篇:使用R语言进行参数估计使用R语言进行假设检验使用R语言进行方差分析使用R语言进行回归分析使用R语言进行回归诊断四、数据...原创 2018-04-04 19:50:17 · 5232 阅读 · 1 评论 -
使用R语言进行时间序列分析
一、时间序列的定义时间序列是将统一统计值按照时间发生的先后顺序来进行排列,时间序列分析的主要目的是根据已有数据对未来进行预测。一个稳定的时间序列中常常包含两个部分,那么就是:有规律的时间序列+噪声。所以,在以下的方法中,主要的目的就是去过滤噪声值,让我们的时间序列更加的有分析意义。二、时间序列的预处理1、平稳性检验:拿到一个时间序列之后,我们首先要对其稳定性进行判断,只有非白噪声的稳定性时间序列...原创 2018-04-08 10:50:32 · 118245 阅读 · 2 评论 -
R语言常用包分类
R语言常用函数包转载 2018-01-03 16:09:27 · 4086 阅读 · 0 评论 -
R语言绘图样式设置(符号、线条、颜色、文本属性)
设置图像样式有两种方法,一种是全局修改,一种只针对一幅图片有效。全局修改[python] view plain copya<-c(1:10) #全局修改 old_par<-par(no.readonly=TRUE) #记录默认样式到变量old_par中 par(lty=2,pch=17) #设置线型lty=2虚线,pch=17实心三角形,键值对的方式...转载 2018-02-08 21:03:30 · 88251 阅读 · 0 评论 -
R语言中的分屏函数
1、使用par(mfrow=c(2,2))即可 (论文中的使用方法)[plain] view plain copy>par(mfrow=c(3,3)) > plot(Nile) > plot(Nile) > plot(Nile) > plot(Nile) > plot(Nile) > plot(Nile) > plot(Nile) &...转载 2018-03-09 10:41:50 · 5800 阅读 · 0 评论 -
R语言中Legend 函数的参数详解
legend(x, y = NULL, legend, fill = NULL, col = par("col"),border = "black", lty, lwd, pch,angle = 45, density = NULL, bty = "o", bg = par("bg"),box.lwd = par("lwd"), box.lty...原创 2018-03-09 13:43:52 · 70779 阅读 · 1 评论 -
R语言plot函数参数合集
最近用R语言画图,plot 函数是用的最多的函数,而他的参数非常繁多,由此总结一下,以供后续方便查阅。plot(x, y = NULL, type = "p", xlim = NULL, ylim = NULL,log = "", main = NULL, sub = NULL, xlab = NULL, ylab = NULL,ann = par("ann"), axes = TRUE, fra...转载 2018-04-06 00:20:47 · 90056 阅读 · 0 评论 -
R语言数据导入导出总结
#本次学习关键词 save()、load()、read.csv()、write.csv()、read.xlsx()、write.xlsx()#odbcConnect、readChar、sqlQuerystr(iris) #查看数据结构类型、观测值数、列数、以及每个列的大体概况names(iris)#查看数据结构中的列名,及赋值列名#R数据的保存与加载setwd("/Users/gavin...原创 2018-04-06 13:01:33 · 24546 阅读 · 3 评论 -
R语言数据探索功能总结
#本次技能点:#str dim attribute head tail summary quantile hist cov cor aggregate pairs boxplot scatterplot3d plot3d heatmap#使用iris数据集进行数据探索的练习#本次练习点:#str dim attribute head tail summary quantile hist...原创 2018-04-06 16:13:22 · 2194 阅读 · 0 评论 -
使用R语言进行决策树建模
关于决策树的理解及自定义代码实现请参考我的另一个博客:数据挖掘常用算法理解与R语言实现(系列待完成)本次技能点:训练集和测试集的选取决策树构建与减值决策树的print和plot预测值与实际值关系描述用到的函数或包:ctree(party包),rpart(rpart包),set.seed、sample、predict、cptable、cp属性、prune、xerror属性。代码:#一、使用part包...原创 2018-04-06 16:25:03 · 14754 阅读 · 1 评论 -
使用R语言进行回归分析
1、线性回归的基本函数lm<-lm(formula,data=data.frame)#其中formula为回归公式,data为数据源数据框#例如:lm<-lm(y~x1+x2,production)2、与线性模型相关的函数print()原本为打印函数,当参数为线性模型对象时,会打印出模型中的系数以及截距值。基于线性模型操作的对象有很多,比如:predict、summary、...原创 2018-04-06 21:26:11 · 21465 阅读 · 2 评论 -
使用R语言进行回归诊断
人们提出所谓回归诊断的问题,其主要内容有:关于误差项是否满足:独立性、等方差性、正态性。选择线性模型是否合适是否存在异常样本回归分析的结果是否对某些样本依赖过重,也就是回归模型是否具有稳定性自变量之间是否存在高度相关,即是否存在多重共线性下面我们通过一个小例子来大体认识一下回归诊断的重要性。一、使用散点图显示变量之间的关系及修正过程:Anscombe<-data.frame( X =c(...原创 2018-04-07 10:59:02 · 11229 阅读 · 0 评论 -
R语言中的离群点检测方法
本文中将介绍单变量离群点检测、通过聚类检测离群点的例子最后演示从时间序列中检测离群点。一、单变量和多变量的离群点检验。set.seed(123)data<-rnorm(100)#随机生成100个符合正态分布的随机数summary(data)plot(density(data)) #打印出data的概率密度函数#打印出data箱线图,从箱线图中可以看到地步有一个离群值boxplot(...原创 2018-04-07 16:13:11 · 18702 阅读 · 1 评论