matrix----二维矩阵(只允许一种数据类型)
data.frame----二维数据框(每列只允许一种数据类型)
一、新建和读取数据框
#2.新建和读取数据框
df1 <- data.frame(gene = paste0("gene",1:4),
change = rep(c("up","down"),each = 2),
score = c(5,3,-2,-4))
df1
【初学者易错:括号后别忘了还有个逗号哦】
二、读取文件
df2 <- read.csv("gene.csv")
df2
【括号里面是需要读取的文件】
三、数据框
df2<-read.csv("gene.csv")
def1$score #输出数据框的score列数据
dim(df2) #输出df2有多少行多少列
nrow(df2) #输出df2有多少行
ncol(df2) #输出df2有多少列
rownames(df2) #输出df2中的列名
colnames(df2) #输出df2中的行名
1.数据框取子集----按坐标
df2[2,2] #按坐标输出一个元素
df2[2,] #输出第二行
df2[,2] #输出第二列
df2[c(1,3),1:2] #输出1,3行的1至2列元素
2.数据框取子集----按名字
df1[,"gene"]
df1[,c('gene','change')]
【要找的是列元素,则在逗号后输入所在列的列名】
【要找多个列元素,则把所在列的列名输在 c( ) 函数里】
3.数据框修改
(1)修改数据框里的数据
#改一个格
df1[3,3] <- 5
df1
#改一整列
df1$score <- c(12,23,50,2)
df1
【df1$score的意思是,df1数据框的score所在列(行)】
(2)修改行名和列名
#改行名和列名
rownames(df1) <- c("r1","r2","r3","r4")
#只修改某一行/列的名
colnames(df1)[2] <- "CHANGE"
4.两个数据框的连接----merge()函数
#两个数据框的连接
test1 <- data.frame(name = c('jimmy','nicker','Damon','Sophie'),
blood_type = c("A","B","O","AB")) #创建数据框
test1
test2 <- data.frame(name = c('Damon','jimmy','nicker','tony'),
group = c("group1","group1","group2","group2"),
vision = c(4.2,4.3,4.9,4.5)) #创建数据框
test2
test3 <- data.frame(NAME = c('Damon','jimmy','nicker','tony'),
weight = c(140,145,110,138))
test3
merge(test1,test2,by="name") #name为共同列的列名
merge(test1,test3,by.x = "name",by.y = "NAME")