前言
在R语言中,tidyr包的应用 tidyr主要提供了一个类似Excel中数据透视表 (pivottable)的功能; gather和spread函数将数据在长格式和宽格式之间相互转化,应用在比如稀疏矩阵和稠密矩阵之间的转化; separate和union方法提供了数据分组拆分、合并的功能,应用在nominal数据的转化上 R将整洁数据定义为:每个变量的数据存储在自身的列中,每个观测值的数据存储在其自身的行中。整洁数据是进行数据再加工的基础。在tidyr包中,一般包括几个函数:
1、gather()函数
2、spread()函数
3、separate()函数
4、unite()函数
5、缺失值处理replace_na()函数
安装tidyr包与使用tidyr包;
install.packages("tidyr")
library(tidyr)
1、gather()函数
gather()函数,它可以实现将以列位字段的数据表,转化为一列长数据格式。函数使用规则为:
gather(
data,#需要转换的数据,按列排开
key = "key",#将数据表中的所有列赋值给key
value = "value",#将数据表中的所有值赋值给value
...,
na.rm = FALSE,#表示是否删除缺失值,默认为否
convert = FALSE,
factor_key = FALSE
)
示例 1:某班五位同学的考试成绩存在一个宽度数据表中,现在需要我们将这个数据表转化为长度格式的数据。
df <- data.frame(姓名=c('赵','钱','孙','李','周'),
语文=c(95,