第四章:数据操作Ⅰ 第十二节:更易处理的数据表现形式

前言:Tidy Data

Tidy Data是一种数据保存方式,操作十分方便,容易进行建模和可视化,其定义如下:各变量相当于1列,每个观测对应1行,1个观测类型形成1个表

例如:

这种形式的数据

我们可以使用stack(),unstack()函数,分析表现形式的数据与Tidy Date形式的数据之间进行转换

例如

我们使用如下数据进行操作

> x<-data.frame(a=c(3,2,9),b=c(5,3,2),c=c(4,5,7))
> x
  a b c
1 3 5 4
2 2 3 5
3 9 2 7

我们可以使用stack()函数进行数值转换

> (x_stack<-stack(x))
  values ind
1      3   a
2      2   a
3      9   a
4      5   b
5      3   b
6      2   b
7      4   c
8      5   c
9      7   c

由此我们可以针对其产生的数据进行计算平均值

> summaryBy(values~ind,x_stack)
  ind values.mean
1   a    4.666667
2   b    3.333333
3   c    5.333333

当然,我们也可以对已经是Tidy Data的数据进行复原成原来数据

例如

> unstack(x_stack,values~ind)
  a b c
1 3 5 4
2 2 3 5
3 9 2 7
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值