RNote__Reshape2

最新推荐文章于 2022-04-24 22:08:39 发布

whjwindow

最新推荐文章于 2022-04-24 22:08:39 发布

阅读量344

点赞数

分类专栏： Note R 数据整理文章标签： R note 数据整理

本文链接：https://blog.csdn.net/whjwindow/article/details/46653603

版权

R 同时被 3 个专栏收录

9 篇文章 0 订阅

订阅专栏

Note

8 篇文章 0 订阅

订阅专栏

数据整理

3 篇文章 0 订阅

订阅专栏

分解到重组：melt——cast

melt

融化数据，变为长格式；
为泛型函数，具体有：

melt.data.frame for data.frames
melt.array for arrays, matrices and tables
melt.list for lists

## S3 method for class ' data.frame '
melt(data, id.vars, measure.vars,
variable.name = "variable", ..., na.rm = FALSE, value.name = "value",
factorsAsStrings = TRUE)

id.vars是分类关键词，measure.vars是在数据data中只选择部分变量（列）输出。

parse_formula

将字符串转化为cast中的可执行formula。

reshape2:::parse_formula("a + ...", letters[1:6])
reshape2:::parse_formula("a ~ b + d")

cast

浇铸，重组数据。

dcast(data, formula, fun.aggregate = NULL, ..., margins = NULL,
  subset = NULL, fill = NULL, drop = TRUE,
  value.var = guess_value(data))

acast(data, formula, fun.aggregate = NULL, ..., margins = NULL,
  subset = NULL, fill = NULL, drop = TRUE,
  value.var = guess_value(data))

> recast(french_fries, time ~ variable, id.var = 1:4)
Aggregation function missing: defaulting to length（72代表长度）
   time potato buttery grassy rancid painty
1     1     72      72     72     72     72
2     2     72      72     72     72     72
3     3     72      72     72     72     72
4     4     72      72     72     72     72
5     5     72      72     72     72     72
6     6     72      72     72     72     72
7     7     72      72     72     72     72
8     8     72      72     72     72     72
9     9     60      60     60     60     60
10   10     60      60     60     60     60

formula：a~b~c，其中c是最外围维度，b表示列，a表示行。

recast

将melt与cast一步完成；

recast(data, formula, ..., id.var, measure.var)

colsplit

> x <- c("a_1", "a_2", "b_2", "c_3")
> vars <- colsplit(x, "_", c("trt", "time"))
> vars
  trt time
1   a    1
2   a    2
3   b    2
4   c    3
> str(vars)
'data.frame':   4 obs. of  2 variables:
 $ trt : chr  "a" "a" "b" "c"
 $ time: int  1 2 2 3