dplyr包五大基础函数
导入数据
dplyr包规定数据必须导入一个’data frame tbl’ or ‘tbl_df’,即用这两个函数来导入数据到一个变量
转换成dplyr专用的数据类型
varname <- tbl_df (mydata)
打印
输入变量名后,打印前十条数据,且提供更多的信息。
dplyr包的五个基本函数
select() , filter() , arrange() , mutate() , summarize()
1. select函数
作用:选取感兴趣的几列,几个变量,重命名
用法:
select(varname, var1,var2)#Note 会按指定顺序返回
select(varname, var1:var n)#选取1到n,也可以选择相反顺序
select ( varname,new_name = old_name) #选取并重命名
select(cran, -time) #忽略时间这个变量(用负号)
。参考帮助文档
filter函数选取行
作用:选取感兴趣的行,通过条件筛选
用法:
filter(varname , con,…)
#也可以用 | 来表达 或