a1<-apply(mlp, 2, sum)>150000
#mlp按列,sum大于150000的元素
a1<-a1[a1==FALSE]
a1<-data.frame(a1)
cc0<-row.names(a1)
#提出来小于150000的列名
val1<-as.factor(cc1)
c1<-subset(mlp,select = -c(val1))
#根据列名在dataframe中删除这些列
有时候上面的代码不知为啥删的不干净,用下面的:
tmpdata <- mlp[ , !names(mlp) %in% c(cc0)]
dd1<-data.frame(apply(tmpdata, 2, sum)>150000)
sum(dd1[,1]=='FALSE')
#计算有多少小于150000的列
dd<-colSums(as.matrix(c) > 10)
#计算dataframe c ,每列大于10的元素有多少
#去掉一组数据的最后一个:
tmpdata<-tmp[,-c(length(tmp),length(tmp)-1)]
#对行的筛选:
num3<-data.frame(rowSums(as.matrix(test1)>10))
#得到每行大于10的元素有多少个
ww3<-apply(num3, 1, min)>5
#每行大于10的元素个数,要大于5
length(ww3[ww3==TRUE])
#看一下大于5个有多少
hhh<-tmpdata
#因为怕把原始数据弄乱,这里又赋值hhh
hhh$mode1<-ww3
#增加了以model1为列名的列,里面的元素为logic,TRUE or FALSE
mt10andmt5_1<-hhh[hhh$mode1=='TRUE',]
#选出来为TRUE的
dim(mt10andmt5_1)
#用同样的方
常用的R语言技巧(持续更新):
最新推荐文章于 2024-05-31 20:30:00 发布