apply函数
对矩阵、数据框、数组(二维、多维)等矩阵型数据,按行或列应用函数FUN进行循环计算,并以返回计算结果
apply(X, MARGIN, FUN, ...)
- X:数组、矩阵、数据框等矩阵型数据
- MARGIN: 按行计算或按按列计算,1表示按行,2表示按列
- FUN: 自定义的调用函数
应用iris数据集进行举例,以下计算前四个变量的均值:
a <- apply(iris[,1:4], 2, mean) #前四列数据,按列,求均值
a
# 输出
Sepal.Length Sepal.Width Petal.Length Petal.Width
5.843333 3.057333 3.758000 1.199333
tapply函数
将数据按照不同方式分组,生成类似列联表形式的数据结果
tapply(X, INDEX, FUN = NULL, ..., default = NA, simplify = TRUE)
- X:数组、矩阵、数据框等分割型数据向量
- INDEX:一个或多个因子的列表,每个因子的长度都与x相同
- FUN: 自定义的调用函数
manager <- c(1, 2, 3, 4, 5)
country <- c("US", "US", "UK", "UK", "UK")
gender <- c("M", "F", "F", "M", "F")
age <- c(32, 45, 25, 39, 99)
leadership <- data.frame(manager, country, gender, age)
tapply(leadership$age, leadership$country, mean) # 求在不同country水平下的age的均值
# 输出
UK US
54.33333 38.50000
# 求在不同country和gender交叉水平下的age的均值, 输出得到矩阵数据
tapply(leadership$age, list(leadership$country, leadership$gender), mean)
# 输出
F M
UK 62 39
US 45 32
lapply函数
对列表、数据框数据集进行循环,输入为列表,返回值为列表
lapply(X, FUN, ...)
- X:列表、数据框
- FUN:自定义的调用函数
b <- list(x = 1:10, y = matrix(1:12, 3, 4))
b
# 输出
$x
[1] 1 2 3 4 5 6 7 8 9 10
$y
[,1] [,2] [,3] [,4]
[1,] 1 4 7 10
[2,] 2 5 8 11
[3,] 3 6 9 12
lapply(b, sum) # 求列表中各元素的和
# 输出
$x
[1] 55
$y
[1] 78
sapply函数
类似于lapply函数,但输入为列表,返回值为向量
sapply(X, FUN, ..., )
- X:列表、矩阵、数据框
- FUN:自定义的调用函数
sapply(b, sum) # 求列表中各元素的和
# 输出
x y
55 78