dplyr包是Hadley Wickham的新作,主要用于数据清洗和整理,该包专注dataframe数据格式,从而大幅提高了数据处理速度,并且提供了与其它数据库的接口;tidyr包的作者是Hadley Wickham, 该包用于“tidy”你的数据,这个包常跟dplyr结合使用。
本文将介绍dplyr包的下述五个函数用法:
- 筛选: filter()
- 排列: arrange()
- 选择: select()
- 变形: mutate()
- 汇总: summarise()
- 分组: group_by()
以及tidyr包的下述四个函数用法:
- gather—宽数据转为长数据;
- spread—长数据转为宽数据;
- unit—多列合并为一列;
- separate—将一列分离为多列;
http://blog.csdn.net/h8178/article/details/78258651/
两个链接内容一样