![](https://img-blog.csdnimg.cn/20201014180756738.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据挖掘&R语言
木里先森
中山大学||北京邮电大学
展开
-
解决R语言中save()函数保存对象集合问题-->《R语言编程艺术》P195
解决R语言中save()函数保存对象集合问题–>《R语言编程艺术》P195原创 2018-03-15 19:07:52 · 14004 阅读 · 0 评论 -
R语言中用均值替换、回归插补及多重插补进行插补
用均值替换、回归插补及多重插补进行插补# 设置工作空间# 把“数据及程序”文件夹拷贝到F盘下,再用setwd设置工作空间setwd("E:\\R_workspace\\R语言数据分析与挖掘实战\\chp4")# 读取销售数据文件,提取标题行inputfile <- read.csv('./data/catering_sale.csv', header = TRUE) Vie...原创 2018-05-25 15:32:00 · 15808 阅读 · 11 评论 -
R语言中数据规范化代码
数据规范化代码# 设置工作空间# 把“数据及程序”文件夹拷贝到F盘下,再用setwd设置工作空间setwd("E:\\R_workspace\\R语言数据分析与挖掘实战\\chp4")# 读取数据data <- read.csv('./data/normalization_data.csv', header = FALSE) View(data)# 表格形式呈现fix(...原创 2018-05-25 15:54:52 · 3327 阅读 · 2 评论 -
R语言中K-means函数构建一个聚类模型,并使用图表示聚类记录以及聚类中心
K-means函数构建一个聚类模型,并使用图表示聚类记录以及聚类中心set.seed(2)x <- matrix(rnorm(50 * 2), ncol = 2)x[1:25, 1] <- x[1:25, 1] + 3x[1:25, 2] <- x[1:25, 2] - 4km.out <- kmeans(x, 2, nstart = 20)km.out$...原创 2018-06-04 08:48:59 · 4636 阅读 · 1 评论 -
R语言数据框常见查询用法
R语言数据框常见查询用法# 查询/子集sales[which(sales$Prod=="p2442"),]# 多条件查询sales[which(sales$Prod=="p2443" & sales$Insp=="ok"),]# 错误查询方式# sales[which(sales$Prod=="p4104"& sales$Quant=="NA"),]原创 2018-05-28 10:16:54 · 11970 阅读 · 0 评论 -
R语言中餐饮销量额数据缺失值及异常值检测代码
餐饮销量额数据缺失值及异常值检测代码# 设置工作空间# 把“数据及程序”文件夹拷贝到F盘下,再用setwd设置工作空间setwd("E:\\R_workspace\\R语言数据分析与挖掘实战\\chp3")# 读入数据saledata &lt;- read.csv(file = "./data/catering_sale.csv", header = TRUE) View(sa...原创 2018-05-24 09:29:07 · 905 阅读 · 0 评论 -
R语言中读取xlsx文件的方法
R语言中读取xlsx文件的方法# 安装包install.packages("openxlsx")library(openxlsx)# Lipstick为文件名data&lt;- read.xlsx("Lipstick.xlsx", sheet = 1)View(data)原创 2018-06-04 22:40:41 · 73728 阅读 · 3 评论 -
R语言中Logistic回归
Logistic回归# 设置工作空间# 把“数据及程序”文件夹拷贝到F盘下,再用setwd设置工作空间setwd(&quot;E:\\R_workspace\\R语言数据分析与挖掘实战\\chp5&quot;)# 读入数据Data &amp;lt;- read.csv(&quot;./data/bankloan.csv&quot;)[2:701, ]View(Data)# 查看数据框中 完整的记录数su原创 2018-05-31 16:22:11 · 28131 阅读 · 0 评论 -
R语言中K-Means聚类算法
K-Means聚类算法# 设置工作空间# 把“数据及程序”文件夹拷贝到F盘下,再用setwd设置工作空间setwd(&amp;amp;quot;E:\\R_workspace\\R语言数据分析与挖掘实战\\chp5&amp;amp;quot;)# 读入数据Data &amp;amp;amp;lt;- read.csv(&amp;amp;quot;./data/consumption_data.csv&amp;a原创 2018-06-02 08:40:24 · 4831 阅读 · 1 评论 -
R语言将文件写入CSV,并读取
R语言将文件写入CSV,并读取# 写入文件write.csv(data,file = "mydata.csv",row.names = F)# 读文件data_handle<-read.table("mydata.csv",header=T, sep=",")View(data_handle)原创 2018-06-14 20:05:05 · 50118 阅读 · 1 评论 -
R语言中ARIMA模型
R语言中ARIMA模型setwd("E:\\R_workspace\\R语言数据分析与挖掘实战\\chp5")library(forecast)library(fUnitRoots)Data <- read.csv("./data/arima_data.csv", header = TRUE)[, 2]View(Data)# 时间序列(使用ts()函数进行时间序列转化...原创 2018-06-01 11:21:49 · 14908 阅读 · 3 评论 -
R语言中基于kmeans的离散点检测
R语言中基于kmeans的离散点检测# 设置工作空间# 把“数据及程序”文件夹拷贝到F盘下,再用setwd设置工作空间setwd("E:\\R_workspace\\R语言数据分析与挖掘实战\\chp5")# 读入数据Data <- read.csv("./data/consumption_data.csv", header = TRUE)[, 2:4]View(Data...原创 2018-06-01 20:58:16 · 1169 阅读 · 1 评论 -
R语言中layout()函数的用法
R语言中layout()函数的用法原创 2018-04-19 09:49:34 · 35357 阅读 · 4 评论 -
R语言中mvpart包的加载与使用
mvpart包的加载与使用原创 2018-04-06 10:30:24 · 8274 阅读 · 1 评论 -
R语言对多个文件内容求和
R语言对多个文件内容求和sumtree<-function(drtr){ # 设置起始值为0 sum<-0 # 第一个参数的作用是列出该目录下所有文件的名称 # 第二个参数的作用是 是否显示目录树 fls<-dir(drtr,recursive=TRUE) # 依次读取文件/目录 for(f in fls){ # 拼接路径名 ...原创 2018-03-16 11:21:36 · 2492 阅读 · 0 评论 -
R语言检测文件名后缀案例
R语言检测文件名后缀案例原创 2018-03-16 16:18:52 · 4627 阅读 · 0 评论 -
解决《R语言编程艺术》中read.pnm()中cannot open file 'logo.pgm': No such file or directory的问题
解决《R语言编程艺术》中read.pnm()中cannot open file ‘mtrush1.pgm’: No such file or directory的问题原创 2018-03-10 12:20:21 · 2675 阅读 · 0 评论 -
R语言中fivenum函数的用法?
R语言中fivenum函数的用法?原创 2018-03-19 19:25:56 · 10073 阅读 · 0 评论 -
R语言中cut()函数的用法?
R语言中cut()函数的用法?cut():切割将x的范围划分为时间间隔,并根据其所处的时间间隔对x中的值进行编码。参数:breaks:两个或更多个唯一切割点或单个数字(大于或等于2)的数字向量,给出x被切割的间隔的个数。breaks:采用fivenum():返回五个数据:最小值、下四分位数、中位数、上四分位数、最大值。labels:为区间数,打标签ordered_result...原创 2018-03-19 19:47:10 · 44203 阅读 · 1 评论 -
《数据挖掘:R语言实战》P234中,UCI数据库中白酒品质研究数据集4898个样本下载问题
UCI数据框中白酒品质研究数据集4898个样本下载问题原创 2018-04-07 20:59:33 · 3126 阅读 · 1 评论 -
R语言中sort()函数和order()函数的区别
R语言中sort()函数和order()函数的区别# sor()排序,排序结果不可逆转# 默认是升序# 注意,排序的某个字段--"总成绩"# decreasing为TRUE,表示降序# decreasing为FALSE,表示升序sort(cj$总成绩,decreasing=TRUE)# 表格不受影响View(cj)# order()排序的是索引,利用索引进行表格显示...原创 2018-03-25 22:30:58 · 67000 阅读 · 0 评论 -
R语言中常见函数解释
R语言中常见函数解释subset():从某一个数据框中,选择出符合某条件的数据或者相关列# 提取wine数据集中除quality列以外的数据作为自变量x=subset(wine,select=-quality)# 确定矩阵每行中最大值所在的列prednew=max.col(pred) ...原创 2018-04-09 21:58:46 · 8579 阅读 · 0 评论 -
《数据挖掘:R语言实战》第13章神经网络完整代码
《数据挖掘:R语言实战》第13章神经网络完整代码原创 2018-04-10 22:00:58 · 2402 阅读 · 0 评论 -
解决《数据挖掘:R语言实战》P66中没有‘weather’这个数据集的问题
解决《数据挖掘:R语言实战》P66中没有‘weather’这个数据集的问题原创 2018-03-28 19:59:28 · 3173 阅读 · 0 评论 -
解决R语言导入Excel数据以及计算机丢失jvm.dll问题
解决R语言导入Excel数据以及计算机丢失jvm.dll问题依次安装好R对应的包,然后依次运行下列代码> library(rJava)> library(xlsxjars)> library(xlsx)> data<-read.xlsx("countries.xlsx",1,encoding="UTF-8")报错“计算机丢失jvm.dll”...原创 2018-04-04 18:52:25 · 2935 阅读 · 0 评论 -
R中安装Rattle包的步骤
下载安装GTK+原创 2018-04-12 08:53:30 · 8134 阅读 · 0 评论 -
《数据挖掘:R语言实战》P160数据集的问题
《数据挖掘:R语言实战》P160数据集的问题执行这两句代码,得到的不是“720 14”和“362 14”,可执行以下代码# data_train<-getdata(miete[,c(-1,-3,-12)],sub_train$ID_unit)data_test<-getdata(miete[,c(-1,-3,-12)],-sub_train$ID_unit)...原创 2018-04-05 15:30:48 · 580 阅读 · 1 评论 -
构建ARIMA模型,利用R里面的auto.arima()函数,自动筛选p、d、q
构建ARIMA模型,利用R里面的auto.arima()函数,自动筛选p、d、q# 构建ARIMA模型##################################library(forecast)library(tseries)library(fUnitRoots)terrorism_num=c(1534,1295,1183,1277,1316,1168,1263,1290,11...原创 2018-09-19 22:10:34 · 39522 阅读 · 12 评论