R语言ETL工程:分组(group_by)

3901436-69a8c40562ee2b30

欢迎关注天善智能,我们是专注于商业智能BI,人工智能AI,大数据分析与挖掘领域的垂直社区,学习,问答、求职一站式搞定!

对商业智能BI、大数据分析挖掘、机器学习,python,R等数据领域感兴趣的同学加微信:tstoutiao,邀请你进入数据爱好者交流群,数据爱好者们都在这儿。

作者:黄天元,复旦大学博士在读,目前研究涉及文本挖掘、社交网络分析和机器学习等。希望与大家分享学习经验,推广并加深R语言在业界的应用。

邮箱:[email protected]


本章会讲解如何对数据进行分组。首先我们要明确一点,就是为什么要分组,实际应用的场景是什么?

如果我们现在有一个学校,我们想要分别得到男生和女生的平均身高,就需要分组,也就是根据性别对学生的身高分组,然后分别求平均值。这个例子我们只是分了两组,可能大家还看不到分组的力量。那么,如果我们现在要知道每一个班级数学成绩的平均分,那么我们就要对数据成绩根据班级分组,比如我们一个年级有12个班级,那么就要对12个班级分别计算平均分。当分组的数量越多的时候,如果没有分组的操作,分开来一个一个计算是极其耗时的。所以分组功能在实际工作中,具有非常广泛的应用。

下面我们围绕分组进行举例分析,这次我们会用到R语言自带的mtcars数据集,首先我们把它转化成tibble形式,然后存放在mtcars1中。准备代码如下:


 1library(tidyverse)
2
3mtcars %>% as_tibble() -> mtcars1
4
5mtcars1
6
7## # A tibble: 32 x 11
8## mpg cyl disp hp drat wt qsec vs am gear carb
9## <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
10## 1 21 6 160 110 3.9 2.62 16.5 0 1 4 4
11#
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值