R数据分析入门
雪喵Zmo
我只是一个玩家
展开
-
R语言数据分析入门
#cbind()或rbind()函数将矩阵或向量按行或列合并,形成新的矩阵cbind(1:2,3:4,7:8) [,1] [,2] [,3][1,] 1 4 7[2,] 2 5 8rbind(1:2,4:5,7:8) [,1] [,2] [1,] 1 2[2,] 4 5[3,] 7 8#as.numeric()函数把因子型向...原创 2019-04-20 18:17:37 · 1493 阅读 · 0 评论 -
一元回归分析
首先读取数据,可以是.csv文件或.xlsx文件,最好是前者。> bike <- read.csv("day.csv")利用散点图来确认一下:> library(ggplot2)> qplot(atemp,cnt,data=bike)\\第1个参数是横轴,第2个参数是纵轴,第3个参数是数据框接下来,在geom_smooth()函数中,可以把method参数指...原创 2019-04-20 20:48:06 · 1970 阅读 · 0 评论 -
多元统计分析
> library(dplyr)> bike.cat <- bike %>%+ select(season:weatherisit) %>%+ mutate_each(funs(factor))mutate_each()函数是dplyr程序包提供的对所有列使用同一函数的操作了。由于bike数据中包含的分类变量实际上是数值型,因此这里使用了factor()...原创 2019-04-20 21:47:16 · 3213 阅读 · 0 评论 -
Logistic回归分析
首先像下面这样读入数据\\spambase.data中包含实际数据,spambase.names中包含变量的信息> spambase <- read.csv("spambase.data",header=F)由于该数据文件中不包含变量信息,因此令header=F,使第1行不为变量名。像下面通过read.table()函数读入数据,并通过colnames()函数指定数据框spam...原创 2019-04-21 11:09:04 · 3149 阅读 · 0 评论 -
决策树分析
首先通过data()函数读入数据,并通过str()函数确认其结构。> data(Titanic)> str(Titanic)> Titanic[,1,2,]\\表示第2个变量显示时为第1水平,第3个变量显示时为第2水平然后绘制马赛克图,将交叉统计结果可视化。> mosaicplot(Titanic[,1,2,],color=T)可以使用rpart程序包进行...原创 2019-04-21 12:46:23 · 1162 阅读 · 0 评论