一个之前未解决的遗留问题
之前实习的时候偶然间被询问了一个数据结构变形的问题,但是是在excel里,所以不太会,最近学R,发现R解决起来还挺方便,整理了一下放在这里,以便日后需要再来查阅。
工具:R, tapply, tidyr - spread, sqldf - sqldf
问题描述:
如果有这样的一个数据集
要如何把它变成这种结构:
a1 | b1 | c1 | d1 | |
---|---|---|---|---|
A | 对应sum(GMV) | 对应sum(GMV) | 对应sum(GMV) | 对应sum(GMV) |
B | 对应sum(GMV) | 对应sum(GMV) | 对应sum(GMV) | 对应sum(GMV) |
C | 对应sum(GMV) | 对应sum(GMV) | 对应sum(GMV) | 对应sum(GMV) |
D | 对应sum(GMV) | 对应sum(GMV) | 对应sum(GMV) | 对应sum(GMV) |
构建数据集
Region <- c('A','B','A','B'