日志统计
一、题目内容
题目描述
小明维护着一个程序员论坛。现在他收集了一份"点赞"日志,日志共有 N 行。其中每一行的格式是:ts id 。表示在 ts 时刻编号 id 的帖子收到一个"赞"。现在小明想统计有哪些帖子曾经是"热帖"。如果一个帖子曾在任意一个长度为 D 的时间段内收到不少于 K 个赞,小明就认为这个帖子曾是"热帖"。具体来说,如果存在某个时刻 T 满足该帖在 [T,T+D) 这段时间内(注意是左闭右开区间)收到不少于 K 个赞,该帖就曾是"热帖"。
给定日志,请你帮助小明统计出所有曾是"热帖"的帖子编号。
输入描述
第一行包含三个整数 N,D,K。以下 N 行每行一条日志,包含两个整数 ts 和 id。
其中,1 ≤ K ≤ N ≤ 10^5 ,0 ≤ ts ≤ 10^5 , 0 ≤ id ≤ 10^5 。
输出描述
按从小到大的顺序输出热帖 id。每个 id 一行。
输入输出样例
输入
7 10 2
0 1
0 10
10 10
10 1
9 1
100 3
100 3
输出
1
3
运行限制
最大运行时间:1s
最大运行内存:256M
二、思路分析
尺取法
实现一:
只需要把每个日志获得的点赞信息存储起来,按时间排序,用尺取法 r 在前 l 在后,当点赞数大于等于 k,判断时间间隔,不满足就l往前取,r 继续往后取,直到点赞数大于等于 k 执行相同判断,不断重复直至结束。
声明一个 vector 数组 a[100001] ,能够容的下所有的 id,然后通过输入判断将每个 id 的点赞时间都集中到一起去(使用 a[id].push_back(ts) );然后遍历 a[id] 数组,判断是否是热评:
(1)使用 l,r 变量,初始都设为 0 , sum 记录累计的点赞数。
(2)在 a[id][l] 到 a[id][r] 区域内,如果点赞数 >=k,则进入 if 语句进一步判断时间间隔是否小于 d,若是,则是热帖,直接返回1,不用继续找了;如果时间间隔大于等于 d,则说明在此时间段内不是热帖,要继续找,此时 l++(因为之前的时间跨度已经很大了,所以为了减小时间跨度,l 必须++)。
(3)每次 while 循环,r 都要++,原因:如果在 l 到 r 的范围内,点赞数目不够,则要继续向后找,r++,如果在 l 到 r 的范围内,点赞数目够了,但是间隔太大,也要 r++。
实现二:
(1)定义 i 指针,它是主循环,遍历随时间而流逝的所有帖子。
(2)定义 j 指针,作用是在时刻 i = T,把 [T−D,T) 之前的帖子都置为无效。用 j 遍历 [T-D, T)之前的帖子,每遍历一个帖子,就把它的点赞数减一。注意这里的最关键之处:j 是跟随 i 的,而不是重新循环。
算法的复杂度:排序 O(nlogn),尺取法 O(n),总复杂度为 O(nlogn)。
三、代码实现
#include <bits/stdc++.h>
using namespace std;
int n, d, k;
vector<int>a[100001];
int judge(int i) {
int l = 0, r = 0, sum = 0; //累计点赞数
sort(a[i].begin(), a[i].end()); //默认从小到大,将id = i的帖子的点赞时间从小到大排列
int len = a[i].size();
while (l <= r && r < len) {
sum++; //首先l=r=0时,点赞数为1;
if (sum >= k) { //如果点赞数大于等于k时,判断点赞间隔时间
if (a[i][r] - a[i][l] < d) {
return 1;
} else {
l++;
}
}
r++;
}
return 0;
}
int main() {
cin >> n >> d >> k;
for (int i = 0; i < n; i++) {
int ts, id;
cin >> ts >> id;
a[id].push_back(ts); //将各个Id的点赞时间都集中到一起
}
for (int i = 0; i < 100001; i++) {
if (judge(i)) { //judge(i)函数判断Id = i的帖子是否是热帖
cout << i << endl;
}
}
return 0;
}
#include <bits/stdc++.h>
using namespace std;
const int N = 100001;
int num[N]; //num[i]:记录id=i的帖子的赞的数量
int flag[N]; //flag[i]:id=i的贴子曾是热帖
struct post {
int id;
int ts;
} p[N]; //记录帖子
int cmp(post x, post y) {
return x.ts < y.ts; //按时间从小到大排序
}
int main() {
int n, d, k;
cin >> n >> d >> k;
for (int i = 0; i < n; i++)
cin >> p[i].ts >> p[i].id;
sort(p, p + n, cmp); //按时间从小到大排序
for (int i = 0, j = 0; i < n; i++) {
num[p[i].id]++;
while (p[i].ts - p[j].ts >= d) {
num[p[j].id]--; //随着时间流逝,d之前的每个贴的次数都减1
j++;
}
if (num[p[i].id] >= k) //在区间[i-d,i)上达到k个赞
flag[p[i].id] = 1;
}
for (int i = 0; i < N; i++){
if (flag[i] == 1)
cout << i << endl;
}
return 0;
}
加油哦! 如有错误和需要改进完善之处,欢迎大家纠正指教。