rm r语言保留变量_R语言入门之数据排序、合并、分类汇总

最新推荐文章于 2024-06-18 09:31:32 发布

PixelPioneer

最新推荐文章于 2024-06-18 09:31:32 发布

阅读量520

点赞数

文章标签： rm r语言保留变量

本文链接：https://blog.csdn.net/weixin_36040584/article/details/112520458

版权

1. 数据排序

在R中对数据框中的数据排序，我们通常使用order()函数,该函数默认是升序，但是在要排序的变量前加上减号（-）就相当于降序排列了。

# 以mtcars数据为例对数据进行排序
attach(mtcars) # 固定数据集
# 按变量mpg排序
newdata <- mtcars[order(mpg),] 
# 按变量mpg和cyl排序
newdata <- mtcars[order(mpg, cyl),]
#按变量mpg（升序）和cyl（降序）排序
newdata <- mtcars[order(mpg, -cyl),] 
detach(mtcars) # 解固定数据集

2. 数据合并

2.1 添加列

将数据水平合并时我们通常使用merge()函数，合并时你可以指定一个或者多个关键字段（变量）。当然我们也可以使用cbind()函数，cbind()的使用前提是两数据框的行数相同，并且位置已经匹配完成。

# 按照ID对数据进行合并
total <- merge(dataframeA,dataframeB,by="ID")

# 按照ID和Country对数据框进行合并
total <-merge(dataframeA,dataframeB,by=c("ID","Country"))

2.2 添加行

将数据垂直合并时，我们常常使用rbind()函数，使用该函数时要求两数据框的列数相同，并且变量的顺序已经匹配好了。

# 对数据按行合并
total <- rbind(data frameA, data frameB)

3. 数据分类汇总

在R中对数据进行分类汇总时一件比较容易的事情：

# 对mtcars数据集的变量cyl和vs进行分类汇总并计算各组数值型变量的均值
attach(mtcars) # 固定数据集
aggdata <-aggregate(mtcars, by=list(cyl,vs), 
  FUN=mean, na.rm=TRUE) # 分类汇总
print(aggdata) # 输出结果
detach(mtcars) # 解固定数据集

这里aggregate()函数的FUN=参数是用来指定对各组变量进行的操作，是一个函数（R内置函数或自定义函数），na.rm=是用来指定是否移除缺失值的参数。

关于数据的排序、合并与分类汇总就先讲到这里，有兴趣的朋友可以自行深入探索。

至此，R语言入门的所有内容均已介绍完毕，在后面的内容我会相继带大家入门Python编程以及进阶R语言。想获取更多咨询，请关注公众号【生信与临床】。