标题:日志统计
小明维护着一个程序员论坛。现在他收集了一份"点赞"日志,日志共有N行。其中每一行的格式是:
ts id
表示在ts时刻编号id的帖子收到一个"赞"。
现在小明想统计有哪些帖子曾经是"热帖"。如果一个帖子曾在任意一个长度为D的时间段内收到不少于K个赞,小明就认为这个帖子曾是"热帖"。
具体来说,如果存在某个时刻T满足该帖在[T, T+D)这段时间内(注意是左闭右开区间)收到不少于K个赞,该帖就曾是"热帖"。
给定日志,请你帮助小明统计出所有曾是"热帖"的帖子编号。
【输入格式】
第一行包含三个整数N、D和K。
以下N行每行一条日志,包含两个整数ts和id。
对于50%的数据,1 <= K <= N <= 1000
对于100%的数据,1 <= K <= N <= 100000 0 <= ts <= 100000 0 <= id <= 100000
【输出格式】
按从小到大的顺序输出热帖id。每个id一行。
【输入样例】
7 10 2
0 1
0 10
10 10
10 1
9 1
100 3
100 3
【输出样例】
1
3
资源约定:
峰值内存消耗(含虚拟机) < 256M
CPU消耗 < 1000ms
应用了所谓尺取法:起始时使左右两个指针都指向区间的左端,逐步向后移动右指针,根据具体情境或者向后移动左指针,直到满足相应的条件。
#include <iostream>
#include <vector>
#include <set>
#include <algorithm>
using namespace std;
const int MAXN = 100010;
vector<int> v[MAXN]; //每一个id的点赞时刻记录在一个向量中
set<int> s; //利用其自动去重的性质记录出现过的所有日志id
int n,d,k;
bool solve(int id){
if(v[id].size() < k)
return false;
int start = 0,end = 0,cnt = 0;
sort(v[id].begin(),v[id].end());
while(start <= end && end < v[id].size()){ //start可以等于end,如果相同时刻收到多于k个赞就是这种情况
cnt++;
if(cnt >= k){
//当点赞次数大于等于k的时候,判断是否在t到t+D的时间段内
if(v[id][end] - v[id][start] < d)
return true;
else{
//如果当前区间长度大于d,那如果start不动再往后移end,区间长度更大于d;
//因此应该后移start,同时cnt记录的点赞数量也相应减一
start++;
cnt--;
}
}
end++;
}
return false;
}
int main(){
int ts,id;
cin >> n >> d >> k;
for(int i = 0;i<n;i++){
cin >> ts >> id;
v[id].push_back(ts);
s.insert(id);
}
for(set<int>::iterator it = s.begin();it!=s.end();it++){
int now = *it;
if(solve(now))
cout << now << endl;;
}
return 0;
}