R数据加工厂-plyr包

最新推荐文章于 2024-03-18 20:59:48 发布

华仔宝宝

最新推荐文章于 2024-03-18 20:59:48 发布

阅读量331

点赞数

分类专栏： R与数据分析文章标签： r语言

本文链接：https://blog.csdn.net/hua_chang/article/details/105035762

版权

plyr包的基本函数：
**主函数：ply() 函数族
aaply()函数、adply()函数、alply()函数、daply()函数、ddply()函数、dlply()函数、mply()函数
按输入分类，：分为aply(), dply(), lply()三大类：
aply(.data, .margins, .fun, …, .progress = “none”)
dply(.data, .variables, .fun, …, .progress = “none”)
lply(.data, .fun, …, .progress = “none”)
参数：.data是要进行处理的数组
.margins是用哪种方式去切割数据，取值为1，2，c(1,2)
.fun是对切割的数据指定一个函数进行处理
.progress决定是否显示及用哪种方式显示进度条
.variables指定要按其分割的变量名称
按输出格式来分类：分为aply()、dply()、lply()、_ply()
mply(.data,.fun=NULL,.inform=FALSE,…)
把array或者dataframe的参数数值放进函数中，得到dataframe（mdply），array（maply）或者list（mlply）
install.packages(“plyr”)

#对每列求均值(aply()函数)
library(plyr)
a=matrix(1:21,nrow=3,ncol=7)
b=aaply(a,.margins=2,.fun=mean)
aaply(a,2,.fun=mean)
aaply(a,1,mean,.progress=“text”)
#按变量分组求均值(dply()函数)
names=c(“John”,“Mary”,“Alice”,“Peter”,“Roger”,“Phyillis”)
age=c(13,15,14,13,14,13)
sex=c(“Male”,“Female”,“Female”,“Male”,“Male”,“Female”)
data=data.frame(names,age,sex)
amean=function(data)
{
agemean=mean(data[,2])
return(agemean)
}
daply(data,.(age),.fun=amean)
ddply(data,.(age,sex),.fun=amean)
dlply(data,.(sex),.fun=amean)
#分组求函数(l*ply()函数)
a=c(1,2,3,4,1,5,7,8,9,4,2)
b=c(1,2,5,7,6,4,8,7)
c=c(4,8,9,1,2,3,1)
list=list(a,b,c)
list
llply(list,mean)
laply(list,mean)
ldply(list,mean)

#m*ply函数的应用
data=data.frame(n=c(10,100,50),mean=c(5,5,10),sd=c(1,2,1))
mlply(data,rnorm)
辅助函数（以函数作为输入，以新的函数作为输出）：
mply()函数、splat()函数、each()函数、colwise()函数、failwith()函数、as.data.frame.function()函数、arrang()函数、rename()函数、count()函数、match_df()函数、join()函数
splat()函数
作用：与使用众多的参数不同，该