dplyr有五个核心函数:
函数 | 功能 |
filter() | 对值筛选观测 |
arrange() | 对行进行重新排列 |
select() | 按名称选取变量 |
mutate() | 使用现有变量的函数创建变量 |
summarize() | 对多这个值总结为一个摘要统计量 |
group_by() | 可以改变以上每个函数的作用范围 |
步骤:第一个参数数据框→输入变量名(描述数据要进行的操作)→输出数据框
filter()和arrange()函数还挺像的。filter函数,可以筛选值。而arrange函数可以改变行的顺序。
filter结合表达式用超棒!
arrange可以改变行的顺序。而且还可以结合一些函数使用,比如desc(),实现按列降序排列,desc的位置要在arrange函数里面哦
相比于前两个函数,select函数就是arrange的升级版,arrange函数即使实现了改变行的顺序的功能,但是如果没有被指定改变的,还会在输出的时候看到。但select不一样,select函数选择几列就是几列。可以指定几列,也可以从几列到几列,用":",甚至还可以反着选。select搭配一些函数使用起来也是非常棒的。