前言:Tidy Data
Tidy Data是一种数据保存方式,操作十分方便,容易进行建模和可视化,其定义如下:各变量相当于1列,每个观测对应1行,1个观测类型形成1个表
例如:
这种形式的数据
我们可以使用stack(),unstack()函数,分析表现形式的数据与Tidy Date形式的数据之间进行转换
例如
我们使用如下数据进行操作
> x<-data.frame(a=c(3,2,9),b=c(5,3,2),c=c(4,5,7))
> x
a b c
1 3 5 4
2 2 3 5
3 9 2 7
我们可以使用stack()函数进行数值转换
> (x_stack<-stack(x))
values ind
1 3 a
2 2 a
3 9 a
4 5 b
5 3 b
6 2 b
7 4 c
8 5 c
9 7 c
由此我们可以针对其产生的数据进行计算平均值
> summaryBy(values~ind,x_stack)
ind values.mean
1 a 4.666667
2 b 3.333333
3 c 5.333333
当然,我们也可以对已经是Tidy Data的数据进行复原成原来数据
例如
> unstack(x_stack,values~ind)
a b c
1 3 5 4
2 2 3 5
3 9 2 7