题目
转自新浪微博:“阿里代码库有几亿行代码,但其中有很多功能重复的代码,比如单单快排就被重写了几百遍。请设计一个程序,能够将代码库中所有功能重复的代码找出。各位大佬有啥想法,我当时就懵了,然后就挂了。。。”
这里我们把问题简化一下:首先假设两个功能模块如果接受同样的输入,总是给出同样的输出,则它们就是功能重复的;其次我们把每个模块的输出都简化为一个整数(在 int 范围内)。于是我们可以设计一系列输入,检查所有功能模块的对应输出,从而查出功能重复的代码。你的任务就是设计并实现这个简化问题的解决方案。
输入输出格式
输入格式
输入在第一行中给出 2 个正整数,依次为 N(≤104 )和 M(≤102 ),对应功能模块的个数和系列测试输入的个数。
随后 N 行,每行给出一个功能模块的 M 个对应输出,数字间以空格分隔。
输出格式
首先在第一行输出不同功能的个数 K。随后 K 行,每行给出具有这个功能的模块的个数,以及这个功能的对应输出。数字间以 1 个空格分隔,行首尾不得有多余空格。输出首先按模块个数非递增顺序,如果有并列,则按输出序列的递增序给出。
样例
输入样例
7 3
35 28 74
-1 -1 22
28 74 35
-1 -1 22
11 66 0
35 28 74
35 28 74
输出样例
4
3 35 28 74
2 -1 -1 22
1 11 66 0
1 28 74 35
满分代码
先用map存储每个输出序列的模块个数,然后用优先队列排序即可。
#include <bits/stdc++.h>
using namespace std;
int n, k, m, s, cop;
const int MAXN = 1e4 + 1;
map<vector<int>, int> mp;
struct cmp
{
bool operator()(pair<int, vector<int>> &a, pair<int, vector<int>> &b)
{
if (a.first == b.first)
{ //模块功能个数相同,按对应输出序列递增排序
for (int i = 0; i < a.second.size(); i++)
{
if (a.second[i] == b.second[i])
continue;
return a.second[i] > b.second[i];
}
}
return a.first < b.first; //按模块功能个数排序->大顶堆
}
};
priority_queue<pair<int, vector<int>>, vector<pair<int, vector<int>>>, cmp> pq;
int main()
{
scanf("%d%d", &n, &m);
while (n--)
{
vector<int> arr;
for (int i = 0; i < m; i++)
{
scanf("%d", &k);
arr.emplace_back(k);
}
mp[arr]++;
}
for (auto m : mp)
{
pq.push({m.second, m.first});
}
printf("%d\n", pq.size());
while (!pq.empty())
{
auto p = pq.top();
pq.pop();
printf("%d", p.first);
for (auto x : p.second)
printf(" %d", x);
printf("\n");
}
}