dplyr包是将原本 plyr 包中的 ddply() 等函数进一步分离强化, 专注接受dataframe对象, 大幅提高了速度, 并且提供了更稳健的与其它数据库对象间的接口.
0.1.安装
install.packages("dplyr")
0.2.使用的数据集
mtcars
head(mtcars)
mpg cyl disp hp drat wt qsec vs am gear carb
Mazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4
Mazda RX4 Wag 21.0 6 160 110 3.90 2.875 17.02 0 1 4 4
Datsun 710 22.8 4 108 93 3.85 2.320 18.61 1 1 4 1
Hornet 4 Drive 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1
Hornet Sportabout 18.7 8 360 175 3.15 3.440 17.02 0 0 3 2
Valiant 18.1 6 225 105 2.76 3.460 20.22 1 0 3 1
主要使用
1.1筛选:filter()
filter(.data, ...)
filter_(.data, ..., .dots)
1.2排列:arrange()
arrange(df, ...)
1.3选择:select()
select(.data, ...)
select_(.data, ..., .dots)
rename(.data, ...)
rename_(.data, ..., .dots)
1.4变形: mutate()
1.5汇总: summarise()
2分组动作 group_by()
3连接符 %.%
0.1.安装
install.packages("dplyr")
0.2.使用的数据集
mtcars
head(mtcars)
mpg cyl disp hp drat wt qsec vs am gear carb
Mazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4
Mazda RX4 Wag 21.0 6 160 110 3.90 2.875 17.02 0 1 4 4
Datsun 710 22.8 4 108 93 3.85 2.320 18.61 1 1 4 1
Hornet 4 Drive 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1
Hornet Sportabout 18.7 8 360 175 3.15 3.440 17.02 0 0 3 2
Valiant 18.1 6 225 105 2.76 3.460 20.22 1 0 3 1
主要使用
1.1筛选:filter()
filter(.data, ...)
filter_(.data, ..., .dots)
1.2排列:arrange()
arrange(df, ...)
1.3选择:select()
select(.data, ...)
select_(.data, ..., .dots)
rename(.data, ...)
rename_(.data, ..., .dots)
1.4变形: mutate()
1.5汇总: summarise()
2分组动作 group_by()
3连接符 %.%