R语言dplyr、tidyr使用笔记

最新推荐文章于 2024-05-29 16:11:22 发布

wmissing

最新推荐文章于 2024-05-29 16:11:22 发布

阅读量6.9k

点赞数 14

分类专栏： r语言文章标签： r语言

本文链接：https://blog.csdn.net/pilouduo1367/article/details/69675678

版权

dplyr包
tidyr包

1 dplyr包

1.1 展现数据 `tbl_df()`：

函数tbl_df()使得大数据集规范显示出来，行列都只显示10个，跟head差不多，但是head只能控制行，无法控制列，使用tbl_df()就是为了防止数据刷屏。

> mtcars_df <- tbl_df(mtcars)
> mtcars_df
# A tibble: 32 × 11
     mpg   cyl  disp    hp  drat    wt  qsec    vs    am  gear  carb
*  <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
1   21.0     6 160.0   110  3.90 2.620 16.46     0     1     4     4
2   21.0     6 160.0   110  3.90 2.875 17.02     0     1     4     4
3   22.8     4 108.0    93  3.85 2.320 18.61     1     1     4     1
4   21.4     6 258.0   110  3.08 3.215 19.44     1     0     3     1
5   18.7     8 360.0   175  3.15 3.440 17.02     0     0     3     2
6   18.1     6 225.0   105  2.76 3.460 20.22     1     0     3     1
7   14.3     8 360.0   245  3.21 3.570 15.84     0     0     3     4
8   24.4     4 146.7    62  3.69 3.190 20.00     1     0     4     2
9   22.8     4 140.8    95  3.92 3.150 22.90     1     0     4     2
10  19.2     6 167.6   123  3.92 3.440 18.30     1     0     4     4
# ... with 22 more rows

1.2 筛选数据 `filter()`：

按给定的逻辑判断筛选出符合要求的子数据集

> filter(mtcars_df, mpg == 21, cyl == 6)
# A tibble: 2 × 11
    mpg   cyl  disp    hp  drat    wt  qsec    vs    am  gear  carb
  <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
1    21     6   160   110   3.9 2.620 16.46     0     1     4     4
2    21     6   160   110   3.9 2.875 17.02     0     1     4     4

1.3 排列数据 `arrange()`：

按给定的列名依次对行进行排序

# 先对cyl列正序排列，再对carb列倒序排列
> print(arrange(mtcars_df, cyl, desc(carb)))
    mpg cyl  disp  hp drat    wt  qsec vs am gear carb
1  24.4   4 146.7  62 3.69 3.190 20.00  1  0    4    2
2  22.8   4 140.8  95 3.92 3.150 22.90  1  0    4    2
3  30.4   4  75.7  52 4.93 1.615 18.52  1  1    4    2
4  26.0   4 120.3  91 4.43 2.140 16.70  0  1    5    2
5  30.4   4  95.1 113 3.77 1.513 16.90  1  1    5    2
6  21.4   4 121.0 109 4.11 2.780 18.60  1  1    4    2
7  22.8   4 108.0  93 3.85 2.320 18.61  1  1    4    1
8  32.4   4  78.7  66 4.08 2.200 19.47  1  1    4    1
9  33.9   4  71.1  65 4.22 1.835 19.90  1  1    4    1
10 21.5   4 120.1  97 3.70 2.465 20.01  1  0    3    1
11 27.3   4  79.0  66 4.08 1.935 18.90  1  1    4    1
12 19.7   6 145.0 175 3.62 2.770 15.50  0  1    5    6
13 21.0   6 160.0 110 3.90 2.620 16.46  0  1    4    4
14 21.0   6 160.0 110 3.90 2