上图转自新浪微博:“阿里代码库有几亿行代码,但其中有很多功能重复的代码,比如单单快排就被重写了几百遍。请设计一个程序,能够将代码库中所有功能重复的代码找出。各位大佬有啥想法,我当时就懵了,然后就挂了。。。”
这里我们把问题简化一下:首先假设两个功能模块如果接受同样的输入,总是给出同样的输出,则它们就是功能重复的;其次我们把每个模块的输出都简化为一个整数(在 int 范围内)。于是我们可以设计一系列输入,检查所有功能模块的对应输出,从而查出功能重复的代码。你的任务就是设计并实现这个简化问题的解决方案。
输入格式:
输入在第一行中给出 2 个正整数,依次为 N(≤10的4次方
)和 M(≤10的2次方
),对应功能模块的个数和系列测试输入的个数。
随后 N 行,每行给出一个功能模块的 M 个对应输出,数字间以空格分隔。
输出格式:
首先在第一行输出不同功能的个数 K。随后 K 行,每行给出具有这个功能的模块的个数,以及这个功能的对应输出。数字间以 1 个空格分隔,行首尾不得有多余空格。输出首先按模块个数非递增顺序,如果有并列,则按输出序列的递增序给出。
输入样例:
7 3
35 28 74
-1 -1 22
28 74 35
-1 -1 22
11 66 0
35 28 74
35 28 74
输出样例:
4
3 35 28 74
2 -1 -1 22
1 11 66 0
1 28 74 35
#include <bits/stdc++.h>
using namespace std;
int n,m;
map<string,int> mp;
struct node{
string s;
int num;
int nums[110];
bool operator<(const node& a)const{
if(num!=a.num)
return num>a.num;
else{
for(int i = 0;i<m;i++){
if(nums[i]!=a.nums[i]){
return nums[i]<a.nums[i];
}
}
}
}
}nd[10010];
int main(){
cin>>n>>m;
getchar();
for(int i = 0;i<n;i++){
string s;
getline(cin,s);
mp[s]++;
}
int k=0;
int cnt,one_num;
for(map<string,int>::iterator it=mp.begin();it!=mp.end();it++){
nd[k].s=it->first;
nd[k].num=it->second;
stringstream ss(it->first);
cnt=0;
while(ss>>one_num)
{
nd[k].nums[cnt++]=one_num;
}
k++;
}
sort(nd,nd+k);
cout<<k<<endl;
cout<<nd[0].num<<" "<<nd[0].s;
for(int i = 1;i < k;i++){
cout<<endl<<nd[i].num;
for(int j=0;j<m;j++)
cout<<" "<<nd[i].nums[j];
}
return 0;
}