日常的数据预处理中,不可避免的会遇到数据的各种变形、转换,R语言中的tidyr包函数解决了数据变形上的问题,变量、列的转换。
1、宽数据变长数据
gather(data, key = "key", value = "value", ..., na.rm = FALSE,convert = FALSE, factor_key = FALSE)
参数说明:data数据;
key将原数据所有列赋值给一个新变量,这个新变量就是这里的key,所以当给此参数命名是要注意其含义;
value将原数据所有值赋值给一个新变量,这个新变量就是这里的value,所以当给此参数命名是要注意其含义;
...这个省略号的地方了要注意了,它是选择你需要转换的那些列的,若你省略此处,它便会将所有列转换,另外排除列在列名的前面加 - 即可;
na.rm=FALSE要不要删除缺失值;
convert=FALSE是否需要进行类型转换;
factor_key=FALSE是否存储为字符向量,否则存储为因子,按照原始顺序排列。
2、长数据变宽数据
spread(data, key, value, fill = NA, convert = FALSE, drop = TRUE,sep = NULL)
</