Package dplyr version 1.1.4
Parameters
summarise(.data, ..., .by = NULL, .groups = NULL)
summarize(.data, ..., .by = NULL, .groups = NULL)
参数【.data】:一个数据集(data frame),数据集扩展(比如:tibble),或者 lazy data frames(比如:来自 dbplyr 或 dtplyr)。
参数【...】:<data-masking> 摘要函数的键-值对。名称将是结果中变量的名称。该值可以是:
- 长度为 1 的向量,如 min(x)、n() 或 sum(is.na(y))。
- 数据集,用于从一个表达式中添加多列。
- reframe()。
参数【.by】:<tidy-select> 可选的,仅用于此操作的列分组选择,可替代 group_by()。
参数【.group】:结果的分组结构。
- "drop_last":放弃最后一级分组。这是 1.0.0 版之前唯一支持的选项。
- "drop": 删除所有分组级别。
- "keep": 分组结构与参数【.data】相同。
- "rowwise": 每一行都是自己的组。
如果未指定参数【.group】,则根据结果的行数选择:
- 如果所有结果都只有 1 行,则得到 "drop_last"。
- 如果行数不等,则得到 "保留 "keep"。注意,由于 reframe() 也会无条件地放弃所有级别的分组,返回可变行数的做法已被弃用。
此外,除非结果未分组、选项 "dplyr.summarise.inform " 设置为 FALSE 或从软件包中的函数调用 summarise(),否则会有一条消息通知您这一选择。
summarise() 会创建一个新的数据帧。它为每个分组变量的组合返回一行;如果没有分组变量,输出将只有一行,汇总输入中的所有观测值。它将为每个分组变量包含一列,为您指定的每个汇总统计量包含一列。
summarise() 和 summarize() 是同义词。
Value
通常与参数【.data】属于同一类型的对象。
- 来自底层 group_keys() 的行。
- 列是分组键和您提供的摘要表达式的组合。
- 分组结构由参数【.group】控制,输出可能是另一个分组df、一个 tibble 或一个 rowwise 数据集。
- 数据集属性不会保留,因为 summarise() 从根本上创建了一个新的数据集。
Available functions
- mean(),median()
- sd(),IQR(),mad()
- min(),max()
- first(),last(),nth()
- n(),n_distinct()
- any(),all()