Grouping and Chaining with dplyr
分组函数
group_by函数
用处:对数据进行分组
用法:
>by_package <- group_by(cran,package)
>#cran是tbl变量名,后面可以放分组所依据的变量名
>#打印结果看起来一样,只不过数据上方显示了Groups: package 之后的操作都会一句分组变量来进行
>#例如:summarise(by_package,mean(size)) 则会根据分组计算每一组的平均值
函数 {dplyr包中的}
n():观测值的数目
n_distinct ():独一无二数值的数目
>pack_sum <- summarize(by_package, #分组后的tbl数据
count =n() ,