R统计笔记（三）：分组统计的几种方法

最新推荐文章于 2024-07-29 01:00:00 发布

蚁方阵

最新推荐文章于 2024-07-29 01:00:00 发布

阅读量4w

点赞数 4

分类专栏： R语言文章标签： R语言分组统计统计数据分组函数 apply函数

本文链接：https://blog.csdn.net/yiifaa/article/details/73060915

版权

R语言专栏收录该内容

5 篇文章 4 订阅

订阅专栏

1. 使用tapply函数

#   INDEX相当于groupBy
tapply(salarys$SALARY, INDEX=salarys$SEX, FUN=sum)

如果出现参数的长度不一致的错误，如下:

Error in tapply(salarys$SALARY, INDEX = salarys$SEX, FUN = max) : 
  参数的长度必需相同

请仔细检查salarys $SALARY、salarys$ SEX的长度是否相等，尤其是检查INDEX的类型，如果是list类型，请务必转换为向量：

# 对数据进行处理,返回LIST
salarys$SEX <- lapply(salarys$SEX, function(x) switch(x, FEMALE='女', MALE='男'))
# 返回向量
salarys$SEX <- c(salarys$SEX, recursive = TRUE)

2. 使用by函数

使用by函数可以达到同样的效果，唯一需要注意的是，引用的数据必须全是数据列，例如在本例中，数据最多也只能是salarys[c(‘SALARY’, ‘ID’)]。

by(salarys[c('SALARY')], INDICES = list(salarys$SEX), FUN=max)

3. 使用aggregate函数

aggregate(x=salarys[c('SALARY')], by = list(salarys$SEX, salarys$ID), FUN=max)

聚合函数与group by更相似，例如以上语句就表示按SEX、ID进行分组，结果如下：

  Group.1 Group.2  SALARY
1      男       1  30000
2      男       2    200
3      女       3   1200
4      女       4   3500

从以上的数据可以看出，分组的唯一性由（SEX，ID）决定，所以跟SQL一模一样。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

蚁方阵

关注关注

4
点赞
踩
26

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

R语言分组求和，分组求平均值，分组计数

santiagozhang的博客

02-20

8万+

我们经常可能需要把一个数据按照某一属性分组，然后计算一些统计值。在R语言里面，aggregate函数就可以办到。 ## S3 method for class 'data.frame' aggregate(x, by, FUN, ..., simplify = TRUE, drop = TRUE) 我们常用到的参数是：x, by, FUN。 x, 你想要计算的属性或者列。 by, 是一个list，可以指定一个或者多个列作为分组的基础。 FUN, 指定一个函数，用来计算，可以作用在所有分组的数据上面。假如

R 语言的分组统计

lishangyin88的博客

08-01

4340

分组计算描述性统计量 1.使用aggregate（）分组获取描述性统计量。 aggregate（data，by=list(v1,v2)，mean）这里的分组是用list()来区分。但这个有弊端，只能是单返回值函数。像mean，sd. 2.使用by() 分组计算描述性统计量。（不知道怎么都运行报错！！）语法 by(data，indices，fun)其中data是一个数据框或矩阵。这里fun

参与评论您还未登录，请先登录后发表或查看评论

R语言统计分析——整合和重构

最新发布

maizeman126的博客

07-29

658

其中，x是待折叠的数据对象，by是一个变量名组成的列表，这些变量将被去掉以形成新的观测，而FUN则是用来计算描述性统计量的标量函数，它将被用来计算新观测的值。注意，必须指定要唯一确定每个测量所需的变量（本例是ID和Time），而表示测量变量名的变量（本例是X1和X2）将由程序自动创建。其中，md为已融合的数据，formula描述了想要的最后结果，而fun.aggregate是（可选的）数据整合函数。dcast()函数读取已融合的数据，并使用我们提供的公式和一个（可选的）用于整合数据的函数将其重塑。

R语言 数据分组汇总：求平均值、标准差、标准误

yangyulu1998的博客

04-27

4154

有时，汇总数据框中会出现空的因子组合，即有可能出现的因素组合，但实际上并没有出现在原始数据框架中。由性别和条件的组合来分组：F-安慰剂、F-阿司匹林、M-安慰剂和 M-阿司匹林。4） standard error of the mean （均值标准误差）不同性别受试者，服用阿斯匹林或安慰剂前后的观测值以及变化差值。扩充：安排一步得出均值、计数、标准差、标准误和置信区间的函数。当你想按组对数据进行汇总（包括平均值、标准差等）如果数据中有NA值并希望忽略它们，设置。调用的每个函数，除了。

R语言 统计描述分组统计(各种小方案)

08-23

3853

#加载包 library(tidyverse) #创建一系列数据 data=data.frame( row.names = c('QWE','TYE','WUN','EJN','JDB', 'wuy','okf','Aqe','Bdf','wty') , Chinese = c(50, 60, 64, 55, 59, 54, 61, 63, 64, 66 ), Math = c(72, 68, NA, 29, NA, #这里故意设

R统计笔记（三）分组统计的几种方法

qq_44884577的博客

04-11

2253

R统计笔记（三）分组统计的几种方法

R语言实战笔记--第六&七章统计图形介绍及基本统计方法

Sevan_Li的博客

12-20

5836

R语言实战笔记–第六&七章统计图形介绍及基本统计方法标签（空格分隔）： R语言 箱线图直方图 t检验 Kruskal-Wallis检验 Friedman检验　　R语言实战的第六章和第七章介绍了一些基本的统计图形（直方图、条形图、饼图、核密度图、点图、箱线图）和基本的统计方法（描述性统计量，如均值、方差、标准差、最大/小值、四分位数等，具体可以看本人的数据统计的描述性统计部分的两章：统计量、常用概

R数据分析：方法与案例详解--自学笔记

cm20121878的博客

12-20

1万+

@[TOC] (目录）第二章数据结构与基本运算 2.1 数据类型数值型（numeric）整数小数科学数字符型（character） == 夹杂单引号或者双引号之间==“MR” 逻辑型 ==只能读取T （TRUE）或 F (FALSE)值复数型 a+bi 原始型（raw）以二进制形式保存数据默认值（missing value）不可得到（not available）或缺失值（missing value）时，相关位置可能会被保留并且赋予一个特定的NA 任何NA的运算结果都是NA is.na

多元统计分析（笔记更新中...）

掌握本质的博客

08-30

5737

多远统计分析课程笔记（更新中...）

R语言分组计算描述性统计量

01-07

R语言分组计算描述性统计量在上一篇博客中介绍了如何计算数据整体的描述性统计量，点击查看。这里将注重介绍如何分组计算描述性统计量，介绍两个函数：aggregate()、dexcribe.by() 1、aggregate 这个函数的功能比较强大，它首先将数据进行分组（按行），然后对每一组数据进行函数统计，最后把结果组合成一个比较合适的表格返回。根据数据对象不同它有三种用法，分别应用于数据框（data.frame）、公式（formula）和时间序列（ts）。 aggregate(x, by, FUN, ..., simplify = TRUE) aggregate(formula, data, F

python均值插补法填补缺失值_R语言笔记（四）：特殊值处理

weixin_39728544的博客

11-22

1213

输入数据后，我们就能在 R 中对数据进行一系列的操作了。但现实获得的第一手数据往往都是不完整、不整齐的，比如存在数据本身缺失值、离群值，数据框存在冗余行或列，抑或数据需要进一步加工才能获取有意义的变量等。因此，分析数据前对的数据处理工作极为重要。本文介绍的数据处理内容主要包括：1. 特殊值处理1.1 缺失值1.2 离群值1.3 日期2. 数据转换（base vs. dplyr）2.1 筛选（sub...

R语言进行数据分组聚合统计变换（Aggregating transforms）、计算dataframe数据的分组极差（range）

statistics+insight+vista+power

05-24

261

R语言进行数据分组聚合统计变换（Aggregating transforms）、计算dataframe数据的分组极差（range）

R语言进行数据分组聚合统计变换、计算dataframe数据分组均值、并且在可视化图像中添加分组统计值

statistics+insight+vista+power

10-23

701

R语言进行数据分组聚合统计变换、计算dataframe数据分组均值、并且在可视化图像中添加分组统计值

R语言数据分组聚合统计：R语言使用aggregate函数计算dataframe数据分组聚合的均值（mean）、分组聚合的加和值（sum）、缺失值包含和不包含的情况

statistics+insight+vista+power

09-11

932

R语言数据分组聚合统计：R语言使用aggregate函数计算dataframe数据分组聚合的均值（mean）、分组聚合的加和值（sum）、缺失值包含和不包含的情况

R语言︱数据分组统计函数族——apply族用法与心得