R统计笔记(三):分组统计的几种方法

1. 使用tapply函数

#   INDEX相当于groupBy
tapply(salarys$SALARY, INDEX=salarys$SEX, FUN=sum)

如果出现参数的长度不一致的错误,如下:

Error in tapply(salarys$SALARY, INDEX = salarys$SEX, FUN = max) : 
  参数的长度必需相同

请仔细检查salarys SALARYsalarys SEX的长度是否相等,尤其是检查INDEX的类型,如果是list类型,请务必转换为向量:

# 对数据进行处理,返回LIST
salarys$SEX <- lapply(salarys$SEX, function(x) switch(x, FEMALE='女', MALE='男'))
# 返回向量
salarys$SEX <- c(salarys$SEX, recursive = TRUE)

2. 使用by函数

使用by函数可以达到同样的效果,唯一需要注意的是,引用的数据必须全是数据列,例如在本例中,数据最多也只能是salarys[c(‘SALARY’, ‘ID’)]。

by(salarys[c('SALARY')], INDICES = list(salarys$SEX), FUN=max)

3. 使用aggregate函数

aggregate(x=salarys[c('SALARY')], by = list(salarys$SEX, salarys$ID), FUN=max)

聚合函数与group by更相似,例如以上语句就表示按SEX、ID进行分组,结果如下:

  Group.1 Group.2  SALARY
11  30000
22    200
33   1200
44   3500

从以上的数据可以看出,分组的唯一性由(SEX,ID)决定,所以跟SQL一模一样。

  • 4
    点赞
  • 26
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值