我有一个data.table如下所示.我正在尝试计算数据子集的加权平均值.我尝试了以下MWE的两种方法
set.seed(12345)
dt = data.table(a =c(10,20,25,10,10),b=rnorm(5),c=rnorm(5),d=rnorm(5),e=rnorm(5))
dt$key = sample(toupper(letters[1:3]),5,replace=T)
setkey(dt, key)
首先对.SD进行子集化并使用lapply调用,这不起作用(并且实际上并不是这样)
dt[,lapply(.SD,function(x) weighted.mean(x,.SD[1])),by=key]
其次尝试定义一个函数来应用于.SD,就像我使用ddply一样.
这也失败了.
wmn=function(x){
tmp = NULL
for(i in 2:ncol(x)){
tmp1 = weighted.mean(x[,i],x[,1])
tmp = c(tmp,tmp1)
}
return(tmp)
}
dt[,wmn,by=key]
有关如何最好地做到这一点的任何想法?
谢谢
编辑
更改为所选列上的wmn公式的错误.
第二次编辑
加权平均公式反转并添加了set.seed