得空,那边R在处理些数据,估计得要一天左右时间,不得不喷下R的循环for语句,慢!
言归正传,下面说下我这段时间遇到的问题,解决方法。
1.R语言添加列名
colnames(data)=c("xx","oo","pp")
data是你需要修改列名的数据,若是多个列名,则需要c()
2.R语言 修改单个列名
有时候,可能只需要修改单个列名,如果采用上面这种方法则太费事,可以使用:
names(data)[col_num] <- "m"
,意思是将data数据的第col_num个列名修改为m
3.填补缺失值
mdd[is.na(mdd)]<- 0
,将mdd数据中所有为NA的值替换为0,NA是一个逻辑值,不可使用==作为判断依据
4.R语言求平均数(每行,每列)
例如:
data:
1 1 4
3 4 7
,data 为2*3的数据,求每列和,你可以使用
sum(data[,i])
,求行sum(data[i,])
,其中i表示数字.
你也可以使用apply家族函数
求每行的和
apply(data