R语言【dplyr】——summarise()或summarize()会创建一个新的数据帧。它为每个分组变量的组合返回一行;如果没有分组变量,输出将只有一行,汇总输入中的所有观测值

Package dplyr version 1.1.4


Parameters

summarise(.data, ..., .by = NULL, .groups = NULL)

summarize(.data, ..., .by = NULL, .groups = NULL)

参数【.data】:一个数据集(data frame),数据集扩展(比如:tibble),或者 lazy data frames(比如:来自 dbplyr 或 dtplyr)。

参数【...】:<data-masking> 摘要函数的键-值对。名称将是结果中变量的名称。该值可以是:

  • 长度为 1 的向量,如 min(x)n()sum(is.na(y))
  • 数据集,用于从一个表达式中添加多列。
  • reframe()

参数【.by】:<tidy-select> 可选的,仅用于此操作的列分组选择,可替代 group_by()

参数【.group】:结果的分组结构。

  • "drop_last":放弃最后一级分组。这是 1.0.0 版之前唯一支持的选项。
  • "drop": 删除所有分组级别。
  • "keep": 分组结构与参数【.data】相同。
  • "rowwise": 每一行都是自己的组。

如果未指定参数【.group】,则根据结果的行数选择:

  • 如果所有结果都只有 1 行,则得到 "drop_last"
  • 如果行数不等,则得到 "保留 "keep"。注意,由于 reframe() 也会无条件地放弃所有级别的分组,返回可变行数的做法已被弃用。

此外,除非结果未分组、选项 "dplyr.summarise.inform " 设置为 FALSE 或从软件包中的函数调用 summarise(),否则会有一条消息通知您这一选择。

summarise() 会创建一个新的数据帧。它为每个分组变量的组合返回一行;如果没有分组变量,输出将只有一行,汇总输入中的所有观测值。它将为每个分组变量包含一列,为您指定的每个汇总统计量包含一列。

summarise()summarize() 是同义词。


Value

通常与参数【.data】属于同一类型的对象。

  • 来自底层 group_keys() 的行。
  • 列是分组键和您提供的摘要表达式的组合。
  • 分组结构由参数【.group】控制,输出可能是另一个分组df、一个 tibble 或一个 rowwise 数据集。
  • 数据集属性不会保留,因为 summarise() 从根本上创建了一个新的数据集。

Available functions

  • mean()median()
  • sd()IQR()mad()
  • min()max()
  • first()last()nth()
  • n()n_distinct()
  • any()all()

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

ALittleHigh

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值