求一个论坛的在线人数,假设有一个论坛,其注册ID有两亿个,每个ID从登陆到退出会向一个日志文件中记下登陆时间和退出时间,要求写一个算法统计一天中论坛的用户在线分布,取样粒度为秒。
解答:
一天总共有 60*60*24 = 86400秒。
定义一个长度为86400的整数数组int delta[86400],每个整数对应这一秒的人数变化值,可能为正也可能为负。开始时将数组元素都初始化为0。
然后依次读入每个用户的登录时间和退出时间,将与登录时间对应的整数值加1,将与退出时间对应的整数值减1。
这样处理一遍后数组中存储了每秒中的人数变化情况。
定义另外一个长度为86400的整数数组int online_num[86400],每个整数对应这一秒的论坛在线人数。
假设一天开始时论坛在线人数为0,则第1秒的人数online_num[0] = delta[0]。第n+1秒的人数online_num[n] = online_num[n-1] + delta[n]。
这样我们就获得了一天中任意时间的在线人数。
写代码的时候可以将两个数组合并。
简单代码:
void Statistics(const char* filename)
{
ifstream fin(filename);
const int S = 86400;
int N[S]={0},bgn,end;
while(fin>>bgn>>end)
{
N[bgn] += 1;
N[end] -= 1;
}
fin.close();
for(int i=1; i<S; ++i)
N[i] += N[i-1];
//最终的N[i]中存的就是i时刻在线人数
}
http://hi.baidu.com/nicker2010/item/25eb870ffd08b78002ce1b9c