上图转自新浪微博:“阿里代码库有几亿行代码,但其中有很多功能重复的代码,比如单单快排就被重写了几百遍。请设计一个程序,能够将代码库中所有功能重复的代码找出。各位大佬有啥想法,我当时就懵了,然后就挂了。。。”
这里我们把问题简化一下:首先假设两个功能模块如果接受同样的输入,总是给出同样的输出,则它们就是功能重复的;其次我们把每个模块的输出都简化为一个整数(在 int 范围内)。于是我们可以设计一系列输入,检查所有功能模块的对应输出,从而查出功能重复的代码。你的任务就是设计并实现这个简化问题的解决方案。
输入格式:
输入在第一行中给出 2 个正整数,依次为 N(≤104)和 M(≤102),对应功能模块的个数和系列测试输入的个数。
随后 N 行,每行给出一个功能模块的 M 个对应输出,数字间以空格分隔。
输出格式:
首先在第一行输出不同功能的个数 K。随后 K 行,每行给出具有这个功能的模块的个数,以及这个功能的对应输出。数字间以 1 个空格分隔,行首尾不得有多余空格。输出首先按模块个数非递增顺序,如果有并列,则按输出序列的递增序给出。
注:所谓数列 { A1, ..., AM } 比 { B1, ..., BM } 大,是指存在 1≤i<M,使得 A1=B1,...,Ai=Bi 成立,且 Ai+1>Bi+1。
输入样例:
7 3
35 28 74
-1 -1 22
28 74 35
-1 -1 22
11 66 0
35 28 74
35 28 74
输出样例:
4
3 35 28 74
2 -1 -1 22
1 11 66 0
1 28 74 35
思路讲解:
首先,使用了map<vector<int>,int> f
来存储功能模块的对应输出以及出现的次数。这里的vector<int>
用作键,表示功能模块的对应输出,而int表示该输出对应的功能模块出现的次数。
接下来,定义了一个vector< pair< int,vector<int> > > f1
,它用来存储排序后的输出结果。这里的pair中,int表示功能模块出现的次数的负数(为了方便排序),vector<int>表示功能模块的对应输出。
在主函数main()中,首先读取输入的功能模块个数n和系列测试输入的个数m。
然后,使用两层循环遍历每个功能模块的输出,并将其存储在map f中。在这个过程中,如果遇到相同的输出,对应的次数会自增。
for(int i=0;i<n;i++){
vector<int> t;
for(int j=0;j<m;j++){
int a;
cin>>a;
t.push_back(a);
}
f[t]++;
}
接着,使用了一个循环将map f中的数据转存到vector<pair> f1中,并按照特定规则排序。这里的排序规则是按照功能模块出现的次数的负数进行排序,以及输出序列的递增序。
for(auto &s : f) f1.push_back({-s.second,{s.first}});
sort(f1.begin(),f1.end());
最后,输出结果,首先输出了功能模块的个数,然后按照功能模块个数非递增顺序输出,并列则按输出序列的递增序给出。
for(auto &t : f1){
cout<<-t.first;
for(auto &k : t.second){
cout<<" "<<k;
}
cout<<endl;
}
完整代码:
#include <bits/stdc++.h>
#include <map>
using namespace std;
map<vector<int>,int> f;
vector< pair< int,vector<int> > > f1;
int main()
{
int n,m;
cin>>n>>m;
for(int i=0;i<n;i++){
vector<int> t;
for(int j=0;j<m;j++){
int a;
cin>>a;
t.push_back(a);
}
f[t]++;
}
printf("%d\n",f.size());
for(auto &s : f) f1.push_back({-s.second,{s.first}});
sort(f1.begin(),f1.end());
for(auto &t : f1){
cout<<-t.first;
for(auto &k : t.second){
cout<<" "<<k;
}
cout<<endl;
}
}