更简洁和高效的遍历函数（下）-CSDN博客

本文链接：https://blog.csdn.net/2301_79425796/article/details/142639896

下面内容摘录自《用R探索医药数据科学》专栏文章的部分内容。栏目后续章节的文章将深入概括R语言在临床研究和新药创新领域的应用，填补了国内R教材中尚未广泛覆盖的部分内容。

3章5节：R的循环与遍历函数全解析_r语言遍历分析-CSDN博客文章浏览阅读705次。通过对 R 语言的循环与遍历函数的全面解析，我们已经初步了解了其内部的工作原理、多样的应用方法以及在实际编程中的重要性，为我们在以后的数据分析工作中提供灵活而高效的数据处理手段。_r语言遍历分析https://blog.csdn.net/2301_79425796/article/details/140821518?csdn_share_tail=%7B%22type%22%3A%22blog%22%2C%22rType%22%3A%22article%22%2C%22rId%22%3A%22140821518%22%2C%22source%22%3A%222301_79425796%22%7D

欢迎订阅我们专栏

.......前面部分请点击上面链接看原文（原文6371字）

二、遍历函数

apply()函数可以作用于矩阵和数据框的行或者列。第一个参数指定了函数应用的数据集；第二个参数必须给出将应用函数的维度，1代表行，2代表列；第三个参数是要应用的函数。

# 创建一个矩阵 y，包含从标准正态分布中生成的6个随机数，矩阵大小为2行3列
y <- matrix(rnorm(1:6), 2, 3)
y
#            [,1]       [,2]       [,3]
# [1,]  0.05728972 -0.1897873 -1.5429184
# [2,] -0.15039963 -0.1471385 -0.1534776

# 使用 apply 函数对矩阵 y 的每一行（MARGIN=1）进行求和操作
apply(y, 1, sum)
# [1] -1.6754159 -0.4510157

# 使用 apply 函数对矩阵 y 的每一列（MARGIN=2）找到最大值所在的位置
apply(y, 2, which.max)
# [1] 1 2 2

4、 tapply()函数

tapply() 是 R 语言中的一个函数，用于对数据的子集应用函数并返回结果。它常用于分组数据的汇总统计。tapply() 可以按照因子或因子列表对向量进行分组，然后对每个分组应用指定的函数。以下是 tapply() 函数的一般用法：

tapply(X, INDEX, FUN = NULL, ..., simplify = TRUE)

X：要处理的向量。
INDEX：一个因子或因子列表，用于定义 X 中元素的分组。
FUN：要应用的函数。
...：传递给 FUN 的其他参数。
simplify：逻辑值，指示是否对结果进行简化。

假设我们有一个向量 data，表示一些数据值，以及一个因子 group，表示每个数据值所属的组。我们可以使用 tapply() 按组计算均值。

# 示例数据
data <- c(10, 20, 30, 40, 50, 60)
group <- factor(c("A", "A", "B", "B", "C", "C"))

# 按组计算均值
result <- tapply(data, group, mean)
print(result)

结果是：

 A  B  C 
15 35 55

假设我们有两个因子 group1 和 group2，我们可以使用 tapply() 按多个因子进行分组。

# 示例数据
data <- c(10, 20, 30, 40, 50, 60)
group1 <- factor(c("A", "A", "B", "B", "C", "C"))
group2 <- factor(c("X", "Y", "X", "Y", "X", "Y"))

# 按多个因子分组计算均值
result <- tapply(data, list(group1, group2), mean)
print(result)

结果是：

组 A 和 X 的均值为 10，这是因为在 data 中与 group1 = A 且 group2 = X 对应的值是 10；组 A 和 Y 的均值为 20，原因是 data 中与 group1 = A 且 group2 = Y 对应的值是 20；组 B 和 X 的均值为 30，是由于 data 中与 group1 = B 且 group2 = X 对应的值是 30；组 B 和 Y 的均值为 40，是因为 data 中与 group1 = B 且 group2 = Y 对应的值是 40；组 C 和 X 的均值为 50，因为 data 中与 group1 = C 且 group2 = X 对应的值是 50；组 C 和 Y 的均值为 60，是由于 data 中与 group1 = C 且 group2 = Y 对应的值是 60。通过上述代码示例，能够清晰地看到 tapply() 函数是如何按照多个因子进行分组，并针对每个分组应用指定的函数（此处为 mean），最终得到一个涵盖各组均值的矩阵。

5、mapply()函数

mapply()函数是lapply函数的多元版本。它可以对多个列表中的元素进行并行的函数求值。

# 定义一个函数，该函数将两个数相加
add <- function(x, y) {
  return(x + y)
}

# 创建两个列表
list1 <- list(1, 2, 3)
list2 <- list(4, 5, 6)

# 使用 mapply() 对两个列表中的元素进行并行求和
result <- mapply(add, list1, list2)

# 打印结果
print(result)

结果是：

[1] 5 7 9

首先，定义了一个能接受两个参数并返回它们和的函数 add 。接着创建了分别包含三个数的两个列表 list1 和 list2 。使用 mapply() 函数时，其传入的第一个参数是函数 add ，随后是要并行处理的两个列表 list1 和 list2 。mapply(add, list1, list2) 会对 list1 和 list2 中的对应元素进行并行求和，第一次调用 add(1, 4) 返回 5 ，第二次调用 add(2, 5) 返回 7 ，第三次调用 add(3, 6) 返回 9 ，最终 mapply() 函数返回的结果是一个向量 [5, 7, 9] 。

通过对 R 语言的循环与遍历函数的全面解析，我们已经初步了解了其内部的工作原理、多样的应用方法以及在实际编程中的重要性，为我们在以后的数据分析工作中提供灵活而高效的数据处理手段。

在这里，你学到的并非仅仅是 R 的某一个技巧，而是能够从零开始，深入且系统地学习 R 语言。此外，本专栏每周至少定期更新三篇文章，每篇文章篇幅均在 5000 字以上。而且，对于已经发表的知识点，我们也会根据新的技术或理解及时进行更新，这是纸质版图书无法做到的。为了让更多的忠实粉丝和同学们享受到实惠，本专栏采用折扣定价策略。随着章节的不断完成，折扣力度会逐渐减小。所以，现在正是订阅的最佳时机！

https://blog.csdn.net/2301_79425796/category_12729892.html?spm=1001.2014.3001.5482