rm r语言 保留变量_R语言入门之数据排序、合并、分类汇总

1. ​数据排序

在R中对数据框中的数据排序,我们通常使用order()函数,该函数默认是升序,但是在要排序的变量前加上减号(-)就相当于降序排列了。

# 以mtcars数据为例对数据进行排序
attach(mtcars) # 固定数据集
# 按变量mpg排序
newdata <- mtcars[order(mpg),] 
# 按变量mpg和cyl排序
newdata <- mtcars[order(mpg, cyl),]
#按变量mpg(升序)和cyl(降序)排序
newdata <- mtcars[order(mpg, -cyl),] ​
detach(mtcars) # 解固定数据集

2. ​数据合并

2.1 添加列

将数据水平合并时我们通常使用merge()函数,合并时你可以指定一个或者多个关键字段(变量)。当然我们也可以使用cbind()函数,cbind()的使用前提是两数据框的行数相同,并且位置已经匹配完成。

# 按照ID对数据进行合并
total <- merge(dataframeA,dataframeB,by="ID")
# 按照ID和Country对数据框进行合并
total <-merge(dataframeA,dataframeB,by=c("ID","Country")) 

2.2 ​添加行

将数据垂直合并时,我们常常使用rbind()函数,使用该函数时要求两数据框的列数相同,并且变量的顺序已经匹配好了。

# 对数据按行合并
total <- rbind(data frameA, data frameB) 

3. ​数据分类汇总

在R中对数据进行分类汇总时一件比较容易的事情:

# 对mtcars数据集的变量cyl和vs进行分类汇总并计算各组数值型变量的均值
attach(mtcars) # 固定数据集
aggdata <-aggregate(mtcars, by=list(cyl,vs), 
  FUN=mean, na.rm=TRUE) # 分类汇总
print(aggdata) # 输出结果
detach(mtcars) # 解固定数据集

这里aggregate()函数的FUN=参数是用来指定对各组变量进行的操作,是一个函数(R内置函数或自定义函数),na.rm=是用来指定是否移除缺失值的参数。

关于数据的排序、合并与分类汇总就先讲到这里,有兴趣的朋友可以自行深入探索。

​至此,R语言入门的所有内容均已介绍完毕,在后面的内容我会相继带大家入门Python编程以及进阶R语言。想获取更多咨询,请关注公众号【生信与临床】。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值