日志统计
小明维护着一个程序员论坛。现在他收集了一份"点赞"日志,日志共有N行。
其中每一行的格式是:ts id
表示在ts时刻编号id的帖子收到一个"赞"。
现在小明想统计有哪些帖子曾经是"热帖"。如果一个帖子曾在任意一个长度为D的时间段内收到不少
于K个赞,小明就认为这个帖子曾是"热帖"。
具体来说,如果存在某个时刻T满足该帖在[T, T+D)这段时间内(注意是左闭右开区间)收到不少于K个赞,该帖就曾是"热帖"。
给定日志,请你帮助小明统计出所有曾是"热帖"的帖子编号。
【输入格式】
第一行包含三个整数N、D和K。
以下N行每行一条日志,包含两个整数ts和id。
对于50%的数据,1 <= K <= N <= 1000
对于100%的数据,1 <= K <= N <= 100000 0 <= ts <= 100000 0 <= id <= 100000
【输出格式】
按从小到大的顺序输出热帖id。每个id一行。
【输入样例】
7 10 2
0 1
0 10
10 10
10 1
9 1
100 3
100 3
【输出样例】
1
3
题意
①、热帖定义:存在某个时刻T满足该帖在[T, T+D)这段时间内(注意是左闭右开区间)收到不少于K个
赞,该帖就曾是"热帖"。
②、统计出所有曾是"热帖"的帖子编号。
解题思路
题目要求在给定的时间区间([T, T+D))范围内,统计出曾是"热帖"的帖子编号。
很显然,既然是在给定区间内做统计,那就要用到尺取法的思想来解题。
ps:若对尺取法不太熟悉的朋友,可以点击下面链接学习、巩固。
尺取法详解与练习
数据处理
尺取法的应用要在有序的条件下进行,但题目给我们的是无序的 ts 与 id ,那如何巧妙地将 ts 与 id 的数据进行处理呢?
①、ts 与 id 之间是有联系、不可分割存储,这里利用结构体的形式将 ts 与 id 联系在一起。
struct node{
int ts;
int id;
};
②、vector工具存储N组 ts 与 id 结构体,并得到结构体组,方便进行排序。
注意:vector最好不要开过大空间,否则将vector中会出现多余的元素,导致下面从小到大的排序出现错误,这里只需开到N就足够了。
vector<node> ts_id(N);
③、尺取法是在时间 ts 上应用,以 ts 的大小来对结构体组的进行排序。
//自定义比较函数
bool cmp(node r1, node r2)
{
return r1.ts<r2.ts;
}
//将vector中的元素按ts从小到大排序
sort(ts_id.begin(), ts_id.end(), cmp);
通过自定义比较函数的方式,能够将结构体组以结构体中的某个变量的大小对结构体组进行排序。
不得不说,sort函数是很实用的排序函数!
尺取法的运用
代码一:
每改变一次左指针,都重新统计[ts_id[r].ts ~ ts_id[l].ts+D)区间上的id出现次数。
这种方法效率并不高,复杂度为O(n2)。
#include