L2-039 清点代码库 (25 分)
题目:
上图转自新浪微博:“阿里代码库有几亿行代码,但其中有很多功能重复的代码,比如单单快排就被重写了几百遍。请设计一个程序,能够将代码库中所有功能重复的代码找出。各位大佬有啥想法,我当时就懵了,然后就挂了。。。”
这里我们把问题简化一下:首先假设两个功能模块如果接受同样的输入,总是给出同样的输出,则它们就是功能重复的;其次我们把每个模块的输出都简化为一个整数(在 int 范围内)。于是我们可以设计一系列输入,检查所有功能模块的对应输出,从而查出功能重复的代码。你的任务就是设计并实现这个简化问题的解决方案。
输入格式:
输入在第一行中给出 2 个正整数,依次为 N(≤104)和 M(≤102),对应功能模块的个数和系列测试输入的个数。
随后 N 行,每行给出一个功能模块的 M 个对应输出,数字间以空格分隔。
输出格式
首先在第一行输出不同功能的个数 K。随后 K 行,每行给出具有这个功能的模块的个数,以及这个功能的对应输出。数字间以 1 个空格分隔,行首尾不得有多余空格。输出首先按模块个数非递增顺序,如果有并列,则按输出序列的递增序给出。
输入样例:
7 3
35 28 74
-1 -1 22
28 74 35
-1 -1 22
11 66 0
35 28 74
35 28 74
输出样例:
4
3 35 28 74
2 -1 -1 22
1 11 66 0
1 28 74 35
思路:
- 这里我用的是一个结构体排序加上一个map来对当前模块进行定位,要注意的点是在cmp中我们需要注意按字典序大小排列,只要把结构体当中存的数组拿出来比较即可,由于复杂度比较大,所以我这里的输入输出用的不是cout和cin,同时这个程序会受评测机的影响,有时候可能要多交几次才能过全部数据点。
- 另一种思路是将输入的每一行当成字符串读取进来,这样复杂度会小一点,只不过由于会有负数的出现,所以不能单纯的通过字符串比大小来排序
- 证明此代码的能过的图片:
代码:
#include<iostream>
#include<algorithm>
#include<map>
#include<vector>
using namespace std;
struct Mode{
vector<int> nums;
int cnt=0;
}mode[10001];
map<vector<int>,int> mp;
int pos=1;
bool cmp(struct Mode a,struct Mode b)
{
if(a.cnt!=b.cnt)
return a.cnt>b.cnt;
else
{
for(int i=0;i<a.nums.size();i++)
{
if(a.nums[i]<b.nums[i])
return 1;
if(a.nums[i]>b.nums[i])
return 0;
}
}
return 1;
}
int main()
{
int n,k,x;
scanf("%d %d",&n,&k);
string s;
for(int i=0;i<n;i++)
{
vector<int> temp;
for(int j=0;j<k;j++)
{
scanf("%d",&x);
temp.push_back(x);
}
if(!mp[temp])
{
mp[temp]=pos;
mode[mp[temp]].nums=temp;
mode[mp[temp]].cnt++;
pos++;
}
else
{
mode[mp[temp]].cnt++;
}
}
sort(mode+1,mode+pos,cmp);
printf("%d\n",pos-1);
for(int i=1;i<pos;i++)
{
printf("%d ",mode[i].cnt);
for(int j=0;j<mode[i].nums.size();j++)
{
if(j!=0)
printf(" ");
printf("%d",mode[i].nums[j]);
}
cout<<endl;
}
}