题目十:日志统计

目录

题目:

分析:

程序:


题目:

小明维护着一个程序员论坛。现在他收集了一份”点赞”日志,日志共有 N 行。

其中每一行的格式是:

ts id

表示在 ts 时刻编号 id 的帖子收到一个”赞”。

现在小明想统计有哪些帖子曾经是”热帖”。

如果一个帖子曾在任意一个长度为 D 的时间段内收到不少于 K 个赞,小明就认为这个帖子曾是”热帖”。

具体来说,如果存在某个时刻 T 满足该帖在 [T,T+D) 这段时间内(注意是左闭右开区间)收到不少于 K 个赞,该帖就曾是”热帖”。

给定日志,请你帮助小明统计出所有曾是”热帖”的帖子编号。

输入格式

第一行包含三个整数 N,D,K。

以下 N 行每行一条日志,包含两个整数 ts 和 id。

输出格式

按从小到大的顺序输出热帖 id。

每个 id 占一行。

数据范围

1≤K≤N≤10E5,
0≤ts,id≤10E5,
1≤D≤10000

输入样例:

7 10 2
0 1
0 10
10 10
10 1
9 1
100 3
100 3

输出样例:

1
3

分析:

第一行包含三个整数 N,D,K:就是输入的三个数中N代表行数,也就是输入的数据条数;D代表的是有效的时间间隔;K代表的是在有效时间间隔之内,点赞数的下限。

这样一来,题目分析清楚之后,编程逻辑就是:根据N的大小来处理循环的次数,根据点赞数以及时效的限制来进行程序的退出。

程序:

from bisect import bisect_left #二分查找数据库
maxn = int(1e5+50)  #防止溢出
n,d,k = map(int,input('请分别输入行数N,时间长度D,最少的赞数K').split(','))
m=[[] for _ in range(maxn)]
print(m)
post = set()  #存储出现的id
for _ in range(n):
    ts,idd = map(int,input('请输入第{}行的数据:'.format(_)).split(','))
    post.add(idd)
    m[idd].append(ts)
post = sorted(post)
print(post)
for idd in post:
    m[idd] = sorted(m[idd])
    for i in range(len(m[idd])):
        td = m[idd][i]+d
        #这里用到了bisect_left函数,这是二分查找数据库里的一个函数,含义是:如列表m[idd]=[0, 
        # 1,2,3],这时如果td=3,则输出3;
        #bisect_right:含义是:如列表m[idd]=[0,1,2,3],这时如果td=3,则输出4;    
        #这两个的区别是输出符合要求的左边一个下标或者右边一个下标。            
        #果要判断的数为3,则输出  
        if (bisect_left(m[idd],td)-i>=k):
            print(idd)
            break
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值