# 导入dplyr包 用filter
install.packages("dplyr")
library(dplyr)
# 将iris中Petal Length大于等于4的花(每一行是一朵花)提取出来,放到新dataframe中
virginica <- filter(iris, Petal.Length >= 4)
(2)subset函数,从某一个数据框中选择出符合某条件的数据或是相关的列
1)单条件查询
df<data.frame(Age=c(22,24,25,26),Gender=c("Girl","Girl","Boy","Boy"),City=c("Shanghai","Beijing","Guangzhou","Nanjing"))
result<-subset(df,Gender=="Girl")
2)指定显示列
reuslt<-subset(df,Gender=="Girl",select=c(City))
3)多条件查询
result=subset(df,Age>22 & Gender=="Girl",select=c(Age,Gender))
result
————————————————
版权声明:本文(2)为CSDN博主「一个人旅行*-*」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/qq_42458954/article/details/81198729R语言获取数据框行数的方法
先建立了两个数据框,然后又合并在了一起,然后再导出
1)dim(dataframe)[1]
2)nrow(dataframe)
3)length(dataframe[,1])
一般用order来对dataframe进行排序
studentAges <- c(23, 34, 34, 89, 90, 35)
studentNames <- c("Bob","Henry","Lily","LiMing","Rose","Jack")
studentDF <- data.frame(studentAges, studentNames)
studentDF
order(studentDF$studentAges)
studentDF[order(studentDF$studentAges),]
用多个columns排序,并使用降序。
studentDF[order(studentDF$studentAges, -studentDF$studentNames),]
data frame保存到一个CSV文件中
write.table(result_order,"t1.csv")
数据框:提取元素
> gene_exp
Sample1 Sample2 Sample3
gene1 1 2.0 0.3
gene2 4 5.0 6.0
gene3 7 0.8 9.0
gene4 10 11.0 12.0
> gene_exp[2,1] # 提取第二行,第一列的元素
[1] 4
> gene_exp[2,3] # 提取第二行,第三列的元素
[1] 6
> gene_exp[2,] # 提取第二行的所有列
Sample1 Sample2 Sample3
gene2 4 5 6
> gene_exp[,2] # 提取第二列的所有元素
[1] 2.0 5.0 0.8 11.0
> gene_exp[2] # 提取第二列(不输入行号,默认提取列)
Sample2
gene1 2.0
gene2 5.0
gene3 0.8
gene4 11.0
> gene_exp[1:3] # 提取第1到3列
Sample1 Sample2 Sample3
gene1 1 2.0 0.3
gene2 4 5.0 6.0
gene3 7 0.8 9.0
gene4 10 11.0 12.0
> gene_exp[c(2:3)] # 提取2到3列
Sample2 Sample3
gene1 2.0 0.3
gene2 5.0 6.0
gene3 0.8 9.0
gene4 11.0 12.0
> gene_exp[c(1,3)] # 提取第1列和第3列
Sample1 Sample3
gene1 1 0.3
gene2 4 6.0
gene3 7 9.0
gene4 10 12.0
> gene_exp$Sample2 # 使用$列名提取某一列
[1] 2.0 5.0 0.8 11.0
作者:曹务强
链接:https://www.jianshu.com/p/365bf1bd4481
来源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
直接使用数据框中的变量
我们可以使用R语言提取数据框中的数据进行画图:
> gene_exp
Sample1 Sample2 Sample3
gene1 1 2.0 0.3
gene2 4 5.0 6.0
gene3 7 0.8 9.0
gene4 10 11.0 12.0
# 以第一列和第三列数据绘制散点图
> plot(gene_exp$Sample1,gene_exp$Sample3)
作者:曹务强
链接:https://www.jianshu.com/p/365bf1bd4481
来源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
用dataframe 中两个元素画图
plot(iris$Petal.Length,iris$Sepal.Length)