拿到手的站点监测数据是小时的文件,并且有很多不需要的信息,主要是清理成自己想要的数据格式,主要用到的是aggregate()函数,具体的做法自己百度。
清理前:
代码:
#主要是清理并合并
tq <- function(input,output){
bb <- dir(input)
cd <- paste(input,bb,sep = "")
m <- NULL
for(i in 1:length(cd)){
aa <- read.csv(cd[i],header = T,fileEncoding = 'utf-8')
#bb <- aggregate(aa["pm2_5_24h"],by = aa[c("date","station_code")],FUN=mean, na.rm=T)
bb <- aggregate(aa["pm2_5"],by = aa[c("date","station_code")],FUN=mean, na.rm=T)
colnames(bb)[3] <- 'pm25'
#cc <- bb[-1,]
m <- rbind(m,bb)
}
filename <- paste(output,sep = "")
write.csv(m,filename,row.names =F)
print("successful!")
}
清理后: