在进行网络日志处理的过程中,有8台服务器的日志需要处理。由于每个IP的访问记录,可能同时存放在多台服务器中。
问题:想知道每个IP的访问记录数是多少?
解决思路:就必须对每台服务器的IP访问量进行统计,然后,利用R语言中的数据框合并(merge(x,y)函数)进行处理
可以写一个数据框合并的函数,然后用Reduce()函数。
Merge_func <- func(x,y){
df <- merge(x, y, by = "IP", all. x = T, all.y = T)
rownames(df) <- df $ Row.names
df$Row.names <- NULL
return(df)
}
IP_all <- Reduce(Merge_func,list(IP_1, IP_2, IP_3,IP_4,IP_5,IP_6,IP_7,IP_8))
(忘记之前从哪个网址看到的代码,下次遇到补上链接)