R语言基础！！！

最新推荐文章于 2024-05-07 14:58:13 发布

Cherry_JJ

最新推荐文章于 2024-05-07 14:58:13 发布

阅读量1.6k

点赞数

文章标签： R语言学习

本文链接：https://blog.csdn.net/Cherry_JJ/article/details/102995799

版权

读取csv文件
read.table函数：read.table函数以数据框格式读入数据，所以适合读取混合模式的数据，但是要求每列的数据类型相同。
read.table读取数据非常方便，通常只需要文件路径、URL或连接对象就可以了，也接受非常丰富的参数设置：

file参数：这是必须的，可以使相对路径或者是绝对路径（注意：Windows下的要用/或者\）
header参数：默认为FALSE即数据框的列名为V1,V2…,设置为TRUE时第一行作为列名。
sep参数：分隔符，默认为空格。可以设置为逗号(comma)sep=’,’，分号(semicolon)sep=’;'和制表符(tab)。
read.csv、read.csv2、read.delim是read.table函数的包装，分隔符分别对应逗号，分号，制表符，同样接受read.table所有参数。
read.csv函数header参数默认为TRUE，不同于read.table。
字符型数据读入时自动转换为因子，因子是R中的变量，它只能取有限的几个不同值，将数据保存为因子可确保模型函数能够正确处理。But当变量作为简单字符串使用时可能出错。要想防止转换为因子：1.令参数stringAsFactors=FALSE,防止导入的数据任何的因子转换。2.更改系统选项options(stringsAsFactors=FALSE)3.指定抑制转换的列：as.is=参数。通过一个索引向量指定，或者一个逻辑向量，需要转换的列取值FALSE,不需要转换的列取值TRUE。

data5<-read.csv('item.csv', stringAsFactors=FALSE)

具体见：R语言参数设置
第一种读法：

getwd()#"C:/Users/Administrator/Documents"查找R的工作区目录
setwd("C:/Users/Administrator/Documents")#建立R的新的工作区目录
data<-read.csv("dazhonginfo.csv")#将文件放入工作区目录下，然后直接读取文件

第二种读法：

data<-read.csv("C:/Users/Administrator/Desktop/dazhonginfo.csv")

is.data.frame(data)#True是否是数据框
ncol(data)#列数
nrow(data)#行数
sal<-max(data$environmentScore)#求data数据的environmentScore列的最大值
#使用条件获取符合条件特定的行，类似于SQL中的where语句
retval <- subset(data, environment == max(environment))
city1 <- subset(data, city == "大连")

建立数据框

df1 = data.frame(name = c("aa", "bb", "cc"), age = c(20, 29, 30),sex = c("f", "m", "f"))
df2 = data.frame(name = c("dd", "cc", "bb"), age = c(40, 35, 36), sex = c("f", "m", "f"))
mergedf = merge(df1, df2, by = "name")#merge函数从两个数据框中选择条件相等的
#行组成一个新的数据框

结果展示

#subset函数从某一个数据框中选择出符合某条件的数据或是相关的列
#（1）单条件查询
selectresult = subset(df1, name == "aa")
#(2)指定显示列
selectresult = subset(df1, name == "aa", select = c(name,sex))
#(3)多条件查询
selectresult = subset(df1, name == "aa" & sex == "f",select = c(age, sex))

R语言常用得基本函数：R语言的基本函数、统计量及其用法

sum/mean/sd/min
which.min()#找出最小值的序号
#多元数据
colMean()#每列，row是行（横向）
colnames()#列名
colSums()#求列和
cov()#协方差矩阵
cor()#相关矩阵
cor.test()#相关系数

R语言中cbind和rbind的区别
cbind：根据列进行合并，即叠加所有列，m列的矩阵与n列的矩阵最后叠加为m+n列，合并前提：cbind（a，c）中的矩阵a、c的行数必须相符。
rbind：根据行进行合并，就是行的叠加，m行的矩阵与n行的矩阵最后变成m+n行的矩阵，前提是：rbind(a,c)中的矩阵a、从、的列数必须相符。
logistic回归分类：

head(iris)#鸢尾花数据的前六行
iris2 = rbind(subset(iris, Species == 'setosa'), subset(iris, Species == 'versicolor'))
X <- cbind(rep(1, nrow(iris2)), iris2$Sepal.Length, iris2$Sepal.Width, iris2$Petal.Length, iris2$Petal.Width)