上图转自新浪微博:“阿里代码库有几亿行代码,但其中有很多功能重复的代码,比如单单快排就被重写了几百遍。请设计一个程序,能够将代码库中所有功能重复的代码找出。各位大佬有啥想法,我当时就懵了,然后就挂了。。。”
这里我们把问题简化一下:首先假设两个功能模块如果接受同样的输入,总是给出同样的输出,则它们就是功能重复的;其次我们把每个模块的输出都简化为一个整数(在 int 范围内)。于是我们可以设计一系列输入,检查所有功能模块的对应输出,从而查出功能重复的代码。你的任务就是设计并实现这个简化问题的解决方案。
输入格式:
输入在第一行中给出 2 个正整数,依次为 N(≤104)和 M(≤102),对应功能模块的个数和系列测试输入的个数。
随后 N 行,每行给出一个功能模块的 M 个对应输出,数字间以空格分隔。
输出格式:
首先在第一行输出不同功能的个数 K。随后 K 行,每行给出具有这个功能的模块的个数,以及这个功能的对应输出。数字间以 1 个空格分隔,行首尾不得有多余空格。输出首先按模块个数非递增顺序,如果有并列,则按输出序列的递增序给出。
注:所谓数列 { A1, ..., AM } 比 { B1, ..., BM } 大,是指存在 1≤i<M,使得 A1=B1,...,Ai=Bi 成立,且 Ai+1>Bi+1。
输入样例:
7 3
35 28 74
-1 -1 22
28 74 35
-1 -1 22
11 66 0
35 28 74
35 28 74
输出样例:
4
3 35 28 74
2 -1 -1 22
1 11 66 0
1 28 74 35
代码长度限制
16 KB
Java (javac)
时间限制
1500 ms
内存限制
128 MB
Python (python3)
时间限制
1500 ms
内存限制
64 MB
其他编译器
时间限制
500 ms
内存限制
64 MB
#include<bits/stdc++.h>
using namespace std;
const int N=1e5+10;
map<vector<int>,int>mp;//不仅可以用来记录string,和char,连vector都可以
struct node
{
int c;
vector<int>g;//vector 是可以直接 进行比较。
//简单说,即 比较两个 vector 上的, 每个位置上的字母 ,
//当发现不同的且字典序小的,拥有该字母的 vector 判定为小。
//但,该方法 不是 严格弱序的,即 vector 无法作为 std::map.find () 的 key 值,
//无法满足 a1<a2, a2<a3-->a1<a3 的场景。
bool operator<(const node&other)const{
if(c==other.c)
return g<other.g;
return c>other.c;
}
};
vector<node>ans;//vector里面是结构体
//调用sort时必须重载sturuct的排序方式
int n,m;
int main()
{
cin>>n>>m;
while(n--)
{
vector<int>v;
for(int i=0;i<m;i++)
{
int x;
cin>>x;
v.push_back(x);
}
if(mp.count(v))mp[v]++;
else mp[v]=1;
}
cout<<mp.size()<<endl;
for(auto i:mp)//把map的键值里的值赋给一个性的结构体
{
node ed;
ed.c=i.second;
ed.g=i.first;
ans.push_back(ed);
}
sort(ans.begin(),ans.end());
for(auto i:ans)
{
cout<<i.c;
for(auto j:i.g)
cout<<' '<<j;
cout<<endl;
}
return 0;
}