R数据加工厂-plyr包

plyr包的基本函数:
**主函数:ply() 函数族
aaply()函数、adply()函数、alply()函数、daply()函数、ddply()函数、dlply()函数、mply()函数
按输入分类,:分为a
ply(), dply(), lply()三大类:
aply(.data, .margins, .fun, …, .progress = “none”)
d
ply(.data, .variables, .fun, …, .progress = “none”)
lply(.data, .fun, …, .progress = “none”)
参数:.data是要进行处理的数组
.margins是用哪种方式去切割数据,取值为1,2,c(1,2)
.fun是对切割的数据指定一个函数进行处理
.progress决定是否显示及用哪种方式显示进度条
.variables指定要按其分割的变量名称
按输出格式来分类:分为
aply()、dply()、lply()、_ply()
m
ply(.data,.fun=NULL,.inform=FALSE,…)
把array或者dataframe的参数数值放进函数中,得到dataframe(mdply),array(maply)或者list(mlply)
install.packages(“plyr”)

#对每列求均值(aply()函数)
library(plyr)
a=matrix(1:21,nrow=3,ncol=7)
b=aaply(a,.margins=2,.fun=mean)
aaply(a,2,.fun=mean)
aaply(a,1,mean,.progress=“text”)
#按变量分组求均值(d
ply()函数)
names=c(“John”,“Mary”,“Alice”,“Peter”,“Roger”,“Phyillis”)
age=c(13,15,14,13,14,13)
sex=c(“Male”,“Female”,“Female”,“Male”,“Male”,“Female”)
data=data.frame(names,age,sex)
amean=function(data)
{
agemean=mean(data[,2])
return(agemean)
}
daply(data,.(age),.fun=amean)
ddply(data,.(age,sex),.fun=amean)
dlply(data,.(sex),.fun=amean)
#分组求函数(l*ply()函数)
a=c(1,2,3,4,1,5,7,8,9,4,2)
b=c(1,2,5,7,6,4,8,7)
c=c(4,8,9,1,2,3,1)
list=list(a,b,c)
list
llply(list,mean)
laply(list,mean)
ldply(list,mean)

#m*ply函数的应用
data=data.frame(n=c(10,100,50),mean=c(5,5,10),sd=c(1,2,1))
mlply(data,rnorm)
辅助函数(以函数作为输入,以新的函数作为输出):
mply()函数、splat()函数、each()函数、colwise()函数、failwith()函数、as.data.frame.function()函数、arrang()函数、rename()函数、count()函数、match_df()函数、join()函数
splat()函数
作用:与使用众多的参数不同,该

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值