PTA-L2-039-清点代码库 (25 分)

最新推荐文章于 2024-03-09 18:42:00 发布

marxoffice

最新推荐文章于 2024-03-09 18:42:00 发布

阅读量1k

点赞数

分类专栏： Python 文章标签： python 算法

本文链接：https://blog.csdn.net/marxoffice/article/details/116176088

版权

Python 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

PTA-Python

平常本人一直用C++刷题，老是觉得python的速度慢，在同样的时间限制下表现不如C++，尤其python的for循环速度慢。今天居然看到一题对python有时间优待的题，试一下用python刷题

题目：L2-039 清点代码库

在这里插入图片描述
上图转自新浪微博：“阿里代码库有几亿行代码，但其中有很多功能重复的代码，比如单单快排就被重写了几百遍。请设计一个程序，能够将代码库中所有功能重复的代码找出。各位大佬有啥想法，我当时就懵了，然后就挂了。。。”

这里我们把问题简化一下：首先假设两个功能模块如果接受同样的输入，总是给出同样的输出，则它们就是功能重复的；其次我们把每个模块的输出都简化为一个整数（在 int 范围内）。于是我们可以设计一系列输入，检查所有功能模块的对应输出，从而查出功能重复的代码。你的任务就是设计并实现这个简化问题的解决方案。

输入格式：

输入在第一行中给出 2 个正整数，依次为 N（≤ $10^4$ ）和 M（≤ $10^2$ ），对应功能模块的个数和系列测试输入的个数。

随后 N 行，每行给出一个功能模块的 M 个对应输出，数字间以空格分隔。

输出格式：

首先在第一行输出不同功能的个数 K。随后 K 行，每行给出具有这个功能的模块的个数，以及这个功能的对应输出。数字间以 1 个空格分隔，行首尾不得有多余空格。输出首先按模块个数非递增顺序，如果有并列，则按输出序列的递增序给出。

注：所谓数列 ${ A_1, ..., A_M}$ 比 ${ B_1, ..., B_M}$ 大，是指存在 $1 \leq i < M$ ，使得 $A_1=B_1，...，A_i=B_i$ 成立，且 $A_{i+1}>B_{i+1}$ 。

输入样例：

输出样例：

代码要求

代码长度限制：16KB

语言	时间限制	内存限制
Java(javac)	1500 ms	128 MB
Python(python3)	1500 ms	64 MB
其他编译器	500 ms	64 MB

感觉这个要求Python3应该可以过的

思路

输入的序列既可以看做字符串"35 28 74"也可以看做元祖(35, 28, 74)这两个都可以作为dict的key，因此可以用dict统计次数。
考虑到最后需要排序输出，用元祖tuple方便一些，可以用元祖把次数和输入封装在一起，调用Python标准库的sort排序。

直接存一个dict{key=tuple, value=int}，统计次数后将它转换为list[tuple(-value,key)]，这里将value取负号可以保证排序的一致性。注意最后输出的时候将value在取负变回来。

Python3中排序函数sort取消了cmp这一参数，只允许输入key，可以引入cmp_to_key这一函数来处理。

代码

N, M = input().split()
N, M = int(N), int(M)
count_dict = dict()             # 统计各种输入的次数
while N > 0:
    N -= 1
    tmp = input().split()
    tmp = tuple(int(x) for x in tmp)   # 把str转成tuple 由于str和tuple都是可hash的，所以都可以作为dict的key
    count_dict[tmp] = count_dict.get(tmp,0) + 1        # 统计参数

# 比较函数格式 小于返回-1 大于返回1 相同返回0
def comp(a, b):
    if a < b:
        return -1
    elif a > b:
        return 1
    else:
        return 0

# 对于不定长度的比较
def rcomp(a,b):
    flag,ptr = 0,0       # 正常来说需要限制ptr的上限
    while flag == 0:     # 但是本题中不存在完全相同的输入(相同的已经被统计在一起了)
        flag = comp(a[ptr],b[ptr])   # 所以排序一定可以终止
        ptr += 1
    return flag

from functools import cmp_to_key    # 引入转换函数
toput = [tuple([-v])+tuple(k) for k,v in count_dict.items()] # 完全tuple化
toput.sort(key=cmp_to_key(rcomp))   # 排序
print(len(toput))
for item in toput:        # 按排序后的顺序输出
    print("{} {}".format(-item[0]," ".join(str(x) for x in item[1:])))