- 因子操作常用函数:
常用函数中的tapply,aggregate,by三个函数参数类似,但是其作用范围有所不同。cut函数是构建因子常用方法,而reshape2包里的melt,cast函数可以对更加灵活地对数据重构和创建因子。
Function | introduce |
---|---|
tapply(x, f, g) | x是向量,f是因子列,g是操作函数。 |
aggregate(x, f, g) | x是数据框或矩阵,f是因子列,g是操作函数,对x中的每一列都进行tapply的操作,tapply的扩展。 |
by(x, f, g) | x是矩阵或者数据框,f是因子列,g是操作函数,按照列表分组后,对分组后数据进行整体操作 |
cut(x,b,labels) | x是向量,b是breaks,labels是levels名(默认FLASE,为1,2,3···),连续型变量生成因子的一种常用方法 |
split(x, f) | x是向量或者数据框,f是因子列,将向量或者数据框根据因子切分成组,返还列表格式 |
- example
##tapply,对mtcars的mpg列根据am,carb分类求均值
tapply(mtcars$mpg, list(mtcars$am, mtcars$carb), mean)
1 2 3 4 6 8