日志统计

最新推荐文章于 2024-05-15 10:55:08 发布

blue_mxy

最新推荐文章于 2024-05-15 10:55:08 发布

阅读量250

点赞数

分类专栏： C++ 蓝桥杯

本文链接：https://blog.csdn.net/blue_mxy/article/details/107945372

版权

蓝桥杯同时被 2 个专栏收录

33 篇文章 1 订阅

订阅专栏

C++

32 篇文章 0 订阅

订阅专栏

 标题：日志统计

小明维护着一个程序员论坛。现在他收集了一份"点赞"日志，日志共有N行。其中每一行的格式是：

ts id  

表示在ts时刻编号id的帖子收到一个"赞"。  

现在小明想统计有哪些帖子曾经是"热帖"。如果一个帖子曾在任意一个长度为D的时间段内收到不少于K个赞，小明就认为这个帖子曾是"热帖"。  

具体来说，如果存在某个时刻T满足该帖在[T, T+D)这段时间内(注意是左闭右开区间)收到不少于K个赞，该帖就曾是"热帖"。  

给定日志，请你帮助小明统计出所有曾是"热帖"的帖子编号。  

【输入格式】
第一行包含三个整数N、D和K。  
以下N行每行一条日志，包含两个整数ts和id。  

对于50%的数据，1 <= K <= N <= 1000  
对于100%的数据，1 <= K <= N <= 100000 0 <= ts <= 100000 0 <= id <= 100000  

【输出格式】
按从小到大的顺序输出热帖id。每个id一行。  

【输入样例】
7 10 2  
0 1  
0 10    
10 10  
10 1  
9 1
100 3  
100 3  

【输出样例】
1  
3  


资源约定：
峰值内存消耗（含虚拟机） < 256M
CPU消耗  < 1000ms


请严格按要求输出，不要画蛇添足地打印类似：“请您输入...” 的多余内容。

注意：
main函数需要返回0;
只使用ANSI C/ANSI C++ 标准;
不要调用依赖于编译环境或操作系统的特殊函数。
所有依赖的函数必须明确地在源文件中 #include <xxx>
不能通过工程设置而省略常用头文件。

提交程序时，注意选择所期望的语言类型和编译器类型。

相信很多人一看到[T,T+D）的时候就已经想到这是在考察区间问题。

步骤：

按时间排序
从0-n分别做区间开头找满足条件的td

注意事项：假设不同起点为区间,我命名为[A,…)、[A+1,…)、[A+2,…)区间

[A,…)区间中计算结果都满足于[A+1,…)区间，除了[A,…)的起点对应的td.
j从0-n不用回溯。

下面算法设计的妙处：

每一次开始新区间的时候j不用回溯，只需把前一个区间起点对应的td出现个数-1就行。
每一个td的数量不会无限增大，因为在开始新区间时候都会把前一个区间起点对应的td出现个数-1；可能td=2这个值在2段不相连的区间都满足：td出现个数>=k,把它加入set去重和排序就好了。

#include <iostream>
#include <cstdio>
#include <algorithm>
#include <vector>
#include <map>
#include <set>
using namespace std;
//日志对象
struct R{
	int ts,td;
};
//自定义比较器
bool cmp(R r1,R r2){
	return r1.ts < r2.ts;	//从小到大排序
}

int main(){
	int n,d,k;				//输入
	cin >> n >> d >> k;
	vector<R> records(n);	//记录日记
	map<int,int> cnt;		//用来记录在[Ti,Ti+j)时间内每一个dt出现的次数
	for(int i = 0;i < n;i++){
		cin >> records[i].ts >> records[i].td;	//输入日志
	}
	set<int> ans;			//记录满足条件的结果 
	//排序，自定义比较器
	sort(records.begin(),records.end(),cmp); 
	//尺取法-哨兵，不断往后移动
	int j = 0;
	for(int i = 0;i < n;i++){
		while(j < n && records[j].ts - records[i].ts < d){//j时刻-i时刻 < d
			cnt[records[j].td]++;			//该id的值加1 
			if(cnt[records[j].td] >= k){	//如果计数满足条件 
				ans.insert(records[j].td);	//将id放入ans中 
			}
			++j;							//往后移动
		}	
		cnt[records[i].td]--;				//重新设定新起点之前，必须将前一个起点的td移除——cnt[records[i].td]--.看下面的例1
	} 
	set<int>::iterator i = ans.begin();
	for(;i != ans.end();i++){
		cout << *i << endl;
	}
	return 0;
}

例1：
旧区间：[A,Aj)
在该区间内计算每一个td的数量并判断：cnt[records[j].td] >= k
新区间：[A+1,Aj)
我们以A+1为起点后就必须：cnt[records[i].td]–;因为上一个区间records[A].td这个值不能把它算进去。

blue_mxy

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
日志统计

标题：日志统计小明维护着一个程序员论坛。现在他收集了一份"点赞"日志，日志共有N行。其中每一行的格式是：ts id 表示在ts时刻编号id的帖子收到一个"赞"。现在小明想统计有哪些帖子曾经是"热帖"。如果一个帖子曾在任意一个长度为D的时间段内收到不少于K个赞，小明就认为这个帖子曾是"热帖"。具体来说，如果存在某个时刻T满足该帖在[T, T+D)这段时间内(注意是左闭右开区间)收到不少于K个赞，该帖就曾是"热帖"。给定日志，请你帮助小明统计出所有曾是"热帖"的帖子编号。.
复制链接

扫一扫

专栏目录