[蓝桥杯 2018 省 B] 日志统计
滑动窗口/双指针/单调队列/取尺
题目描述
小明维护着一个程序员论坛。现在他收集了一份“点赞”日志,日志共有
N
N
N 行。其中每一行的格式是 ts id
,表示在
t
s
ts
ts 时刻编号
i
d
id
id 的帖子收到一个“赞”。
现在小明想统计有哪些帖子曾经是“热帖”。如果一个帖子曾在任意一个长度为 D D D 的时间段内收到不少于 K K K 个赞,小明就认为这个帖子曾是“热帖”。
具体来说,如果存在某个时刻 T T T 满足该帖在 [ T , T + D ) [T,T+D) [T,T+D) 这段时间内(注意是左闭右开区间)收到不少于 K K K 个赞,该帖就曾是“热帖”。
给定日志,请你帮助小明统计出所有曾是“热帖”的帖子编号。
输入格式
第一行包含三个整数 N N N、 D D D 和 K K K。
以下 N N N 行每行一条日志,包含两个整数 t s ts ts 和 i d id id。
输出格式
按从小到大的顺序输出热帖 i d id id。每个 i d id id 一行。
样例 #1
样例输入 #1
7 10 2
0 1
0 10
10 10
10 1
9 1
100 3
100 3
样例输出 #1
1
3
提示
对于 50 % 50\% 50% 的数据, 1 ≤ K ≤ N ≤ 1000 1 \le K \le N \le 1000 1≤K≤N≤1000。
对于 100 % 100\% 100% 的数据, 1 ≤ K ≤ N ≤ 1 0 5 1 \le K \le N \le 10^5 1≤K≤N≤105, 0 ≤ i d , t s ≤ 1 0 5 0 \le id, ts \le 10^5 0≤id,ts≤105。
时限 1 秒, 256M。蓝桥杯 2018 年第九届省赛
CODE
#include<bits/stdc++.h>
using namespace std;
struct cmp{
//自定义结构体函数,自定义一个小顶堆:从高到低越来越大,(出发点)根部最小
bool operator()(const pair<int, int>& a, const std::pair<int, int>& b) {
if (a.first == b.first)return a.second > b.second;//如果key相同按value排序
return a.first > b.first;//否则按key排序
}
};
//vector<int>ans;直接输出 不用结果集
priority_queue<pair<int,int>,vector<pair<int, int>>,cmp>heheap;//自定义一个堆,并且底层用vector实现存储,然后比较采用自定义的比较函数
int main(){
ios::sync_with_stdio(0);cin.tie(nullptr);cout.tie(nullptr);
int n,d,k;cin>>n>>d>>k;
for(int i=0;i<n;++i){
int time,index;
cin>>time>>index;
heheap.push(make_pair(index,time));
}
//对于堆,把东西放东西完毕的时候,里面也就是有序的了,只不过可以自定义,自由度很高,方便底部的删除
while(!heheap.empty()){
// cout<<heheap.top().first<<" "<<heheap.top().second<<endl;
int time=heheap.top().second+d;
//堆顶就是滑动窗口的左端点
//每遍历一个堆顶,就取它的时刻作为窗口左端点,加上限定时间,作为窗口右端点,限定时间为窗口长度
int index=heheap.top().first;//取其id
int counter=1;//只要遍历到了,就计数启动
//重点操作,当我们取到了这个区间所有属性得时候,考虑滑动窗口了,开始区间左边挪开一个
heheap.pop();
//若不为空,对于接下来的每一个堆顶,都进行判断,如果是同一个id(同类),且仍在区间里(时刻不足以另起一个左端点,因为它的时刻仍在一个右端点包含的区间内)
while(!heheap.empty()&&heheap.top().first==index&&heheap.top().second<time){
heheap.pop();//继续挪开左端点
++counter;
///右端点更新,右端点等于当前该点所对应的左端点加上窗口长度
time=heheap.top().second+d;//没有这一步则88分,因为题中说的是任一时刻出发的区间,即滑动窗口=>一开始我不是这样想的(bushi
//你前面pop了,所以后面必须要扩大区间,这个区间比较抽象.
//下一个top()它比较的应该是上一个(当前这步)更新的区间右端点
/************************************************************************
洛谷这道题是有问题的,因为我这样子过了.
真正的做法,按照题意,此处右端点不断扩大,如此下去如果超过了在while外定义的大的右端点,则我们应该马上提交现在的counter,然后更新左端点,避免区间并住,窗口超过题目要求大小
但事实上,我这里做确实超过了题目要求的大小,但也过了,并且时间很快.
前面可以加一个特判,每当更新一个左端点,先看这个左端点对应的id有无已经记录(记录就已经输出了,也可以开一个哈希表判断),如果记录了,就没必要继续操作这个id
因为这个id在这个题目里面的是与否已经得到确定,所以可以剪枝
************************************************************************/
}
if(counter>=k)cout<<index<<endl; //突发奇想,何必拷贝结果集,我处理的数据源就是按id排好序的,当然结果也是按id排好序的
// if(counter>=k)ans.push(index);//若未排序用set
// if(counter>=k)ans.push_back(index);//若已排序用vector接
}
// for(const auto& x:ans)cout<<x<<endl;//输出结果集
return 0;
}
/*
7 10 2
0 1
0 10
10 10
10 1
9 1
100 3
100 3
---->自己排序
1 0
1 9
1 10
3 100
3 100
10 0
10 10
*/