在之前的微信文章介绍过一些Excel处理数据教程,比如 《可以秀给师妹师弟的一些Excel“骚操作”》、《如何用Excel批量查找数据?》、《如何使用Excel对数据进行筛选?》等。处理简单问题时,使用Excel效率会很高,但有些时候需要对数据进行较为复杂的分类汇总,使用Excel非常“不自由”,则需要个性化程度较高的R。 这里主要推荐使用dplyr包对数据进行分类汇总,主要用到以下几个函数:
arrange():数据排序,针对表格的“列”;
filter():按记录数值筛选,针对表格的“行”;
select():按变量名称筛选,针对表格的“列”;
mutate():创建新变量(列);
summarize():统计汇总;
group_by():搭配上面的函数,实现强大的分组统计功能。 为了便于初学者理解记忆,接下来主要通过对照着Excel相应功能,以 《可以秀给师妹师弟的一些Excel“骚操作”》一文的范例数据为例,为大家介绍以上6个核心函数的用法。
1.数据准备
#在线安装dplyr包;
#install.packages("dplyr")
#载入dplyr包;
library(dplyr)
#改变工作目录
setwd("C:/Users/MHY/Desktop/数据的分类汇总统计")
dir()
#读入范例数据,为了方便展示数据仅15行;
dt "Excel小技巧范例数据1.txt",header=T,sep="\t")
dt
2.数据排序
这一部分对应Excel“开始”选项卡下的排序功能,Excel也可以实现多变量排序,如下。