因为最近搞毕业论文,有点忙,加上还有好多粉丝咨询,临近毕业更新就很少了。
今天就写一个非常简单的文章,敷衍一下吧,哈哈哈。
今天要写的就是数据清洗的函数mutate(),这个属于超级基本的内容哦,一般我们拿到数据最头疼应该就是清洗数据了,所以清洗数据的基础一定要牢牢掌握。
还有,如果你想成为一名合格的分析师,其实你只要精通清洗数据就够了,我这么说一点都不夸张。
一个简单数据清洗任务常常包括:
- 从数据中选择列
- 设置数据行
- 汇总数据
- 汇总数据(计算汇总统计信息)
- 排序数据
- 创建新变量
本文就只写最后一个,即在R中使用mutate创建新变量。
mutate的基础知识
在开始之前,我们先谈谈dplyr。
dplyr是R中专门用于数据处理的包。更具体功能包括:
- select() 从数据中选择列
- filter() 数据行的子集
- group_by() 汇总数据
- summarise() 汇总数据(计算汇总统计信息)
- arrange() 排序数据
- mutate() 创建新变量
在大多数情况下,dplyr仅执行这些任务。dplyr出色的部分原因在于它“紧凑”。只有5或6种主要工具,并且非常易于使用。