大神Hadley Wickham的dplyr包更新到了1.0.0版 。今天探究一下里面的神函数select.
首先检查你是否安装了最新版本的dplyr版本
packageVersion("dplyr")
[1] ‘0.8.3’
赶紧更新
install.packages("dplyr")
搞定,1.0.0版
select函数,主要用于列的选择,我们先导入含有五列的经典数据集iris和dplyr包,然后再介绍用法
> library(dplyr)
> data(iris)
> names(iris)
[1] "Sepal.Length" "Sepal.Width" "Petal.Length" "Petal.Width" "Species"
(1)根据列名选择列
select(iris,Species)
第一个参数是数据框名,第二个参数是列名,这里的列名不用加引号
可以选择连续列
select(iris,Sepal.Width:Petal.Width)
(2)根据index选择列
select(iris,1,2)
select(iris,1:3)
(3)两个小技巧
一是可以对选择后的列进行重命名
>new_iris <- select(iris, Class= Species)
>names(new_iris)
[1] "Class"
二是,可以交换选择后的列的顺序
> new_iris <- select(iris,5,1)
> names(new_iris)
[1] "Species" "Sepal.Length"
你学到了吗?