purrr 泛函式循环迭代（map函数介绍）

琪琪花

于 2023-04-27 17:41:25 发布

阅读量414

点赞数 1

文章标签：算法 r语言

本文链接：https://blog.csdn.net/weixin_46636238/article/details/130410573

版权

map系列函数：

map_chr(.x, .f): 返回字符型向量 map_lgl(.x, .f): 返回逻辑型向量

map_dbl(.x, .f): 返回实数型向量 map_int(.x, .f): 返回整数型向量

map_dfr(.x, .f): 返回数据框列表，再 bind_rows 按行合并为一个数据框

map_dfc(.x, .f): 返回数据框列表，再 bind_cols 按列合并为一个数据框

.x 是序列中的一个（代表）元素 .f是对一个元素做的操作

map_*(.x, .f, ...): 依次应用一元函数.f 到一个序列.x 的每个元素，... 可设置.f 的其它参数

map2_*(.x, .y, .f, ...): 依次应用二元函数.f 到两个序列.x, .y 的每对元素，... 可设置.f 的其它参数

pmap_*(.l, .f, ...): 依次应用多元函数.f 到多个序列.l 的每层元素，可实现对数据框逐行迭代，... 可设置.f 的其它参数

示例：

1 对数据框逐列迭代

df = iris[,1:4]
head(df)
Sepal.Length Sepal.Width Petal.Length Petal.Width
1          5.1         3.5          1.4         0.2
2          4.9         3.0          1.4         0.2
3          4.7         3.2          1.3         0.2
4          4.6         3.1          1.5         0.2
5          5.0         3.6          1.4         0.2
6          5.4         3.9          1.7         0.4
map_dbl(df, mean) # 求各列均值
Sepal.Length  Sepal.Width Petal.Length  Petal.Width 
    5.843333     3.057333     3.758000     1.199333 
map_chr(df, mean)
Sepal.Length  Sepal.Width Petal.Length  Petal.Width 
  "5.843333"   "3.057333"   "3.758000"   "1.199333"

2 对数据框逐行迭代

df[1:5,]
Sepal.Length Sepal.Width Petal.Length Petal.Width
1          5.1         3.5          1.4         0.2
2          4.9         3.0          1.4         0.2
3          4.7         3.2          1.3         0.2
4          4.6         3.1          1.5         0.2
5          5.0         3.6          1.4         0.2
pmap_dbl(df[1:5,], ~ mean(c(...))) #逐行平均
 2.550 2.375 2.350 2.350 2.550
map_dbl(asplit(df[1:5,], 1), mean)
 1     2     3     4     5 
2.550 2.375 2.350 2.350 2.550 
asplit(df[1:5,],1)  #asplit功能展示，其实就是按行分割开来
$`1`
Sepal.Length  Sepal.Width Petal.Length  Petal.Width 
         5.1          3.5          1.4          0.2 

$`2`
Sepal.Length  Sepal.Width Petal.Length  Petal.Width 
         4.9          3.0          1.4          0.2 

$`3`
Sepal.Length  Sepal.Width Petal.Length  Petal.Width 
         4.7          3.2          1.3          0.2 

$`4`
Sepal.Length  Sepal.Width Petal.Length  Petal.Width 
         4.6          3.1          1.5          0.2 

$`5`
Sepal.Length  Sepal.Width Petal.Length  Petal.Width 
         5.0          3.6          1.4          0.2

3 批量读取数据并按行合并

files = list.files("data", pattern = "csv",full.names = TRUE, recursive = TRUE)
files
#> [1] "data/六 1 班学生成绩.csv" "data/六 3 班学生成绩.csv"
#> [3] "data/六 4 班学生成绩.csv" "data/六 5 班学生成绩.csv"
#> [5] "data/新建文件夹/六 2 班学生成绩.csv"

map_dfr(files, read_csv)
#> # A tibble: 20 x 6
#> 班级 姓名 性别 语文 数学 英语
#> <chr> <chr> <chr> <dbl> <dbl> <dbl>
#> 1 六 1 班 何娜 女 87 92 79
#> 2 六 1 班 黄才菊 女 95 77 75
#> 3 六 1 班 陈芳妹 女 79 87 66
#> 4 六 1 班 陈学勤 男 82 79 66
#> 5 六 3 班 江佳欣 女 80 69 75
#> # ... with 15 more rows

4 批量绘图并保存图片

以 mtcars 为例，用不同的数值列作为 x 轴，以 mpg 列作为 y 轴，批量绘制散点图，并保存为以列名命名的 png 文件。

先对一个列名完成绘制散点图

x = "disp"
mtcars %>%
ggplot(aes(.data[[x]], mpg)) + # 管道中列名传参方式
geom_point()

改写为函数

plot_scatter = function(x) {
mtcars %>%
ggplot(aes(.data[[x]], mpg)) +
geom_point()
}
cols = names(mtcars)[2:7] # 要绘制的多个列名
ps = map(cols, plot_scatter) # 批量绘图
files = str_c("images/", cols, ".png") # 准备多个文件路径
walk2(files, ps, ggsave)