题目描述:
上图转自新浪微博:“阿里代码库有几亿行代码,但其中有很多功能重复的代码,比如单单快排就被重写了几百遍。请设计一个程序,能够将代码库中所有功能重复的代码找出。各位大佬有啥想法,我当时就懵了,然后就挂了。。。”
这里我们把问题简化一下:首先假设两个功能模块如果接受同样的输入,总是给出同样的输出,则它们就是功能重复的;其次我们把每个模块的输出都简化为一个整数(在 int 范围内)。于是我们可以设计一系列输入,检查所有功能模块的对应输出,从而查出功能重复的代码。你的任务就是设计并实现这个简化问题的解决方案。
输入格式:
输入在第一行中给出 2 个正整数,依次为 N(≤104)和 M(≤102),对应功能模块的个数和系列测试输入的个数。
随后 N 行,每行给出一个功能模块的 M 个对应输出,数字间以空格分隔。
输出格式:
首先在第一行输出不同功能的个数 K。随后 K 行,每行给出具有这个功能的模块的个数,以及这个功能的对应输出。数字间以 1 个空格分隔,行首尾不得有多余空格。输出首先按模块个数非递增顺序,如果有并列,则按输出序列的递增序给出。
注:所谓数列 { A1, ..., AM } 比 { B1, ..., BM } 大,是指存在 1≤i<M,使得 A1=B1,...,Ai=Bi 成立,且 Ai+1>Bi+1。
输入样例:
7 3
35 28 74
-1 -1 22
28 74 35
-1 -1 22
11 66 0
35 28 74
35 28 74
输出样例:
4
3 35 28 74
2 -1 -1 22
1 11 66 0
1 28 74 35
思路想法:
一开始想用set去重,发现set好像不能计数,后来用map进行计数,计数后再进行排序,写一个cmp自定义排序,先排序个数,个数多的在前面,再按上述排数列大小,想到了用vector来存数组,当成map中的一个元素,
不知道去年比赛的时候为啥做不出来,希望今年也可以多几个STL的题吧,希望能想出来。
贴个代码。
#include <iostream>
#include <cstring>
#include <algorithm>
#include <vector>
#include <map>
using namespace std;
int cmp(pair<vector<int>, int> a, pair<vector<int>, int> b)
{
if (a.second == b.second)
{
for (int i = 0; i < a.first.size();)
{
if (a.first[i] == b.first[i])
{
i++;
}
else
{
return a.first[i] < b.first[i];//数组值小的在前面。
}
}
}
else
{
return a.second > b.second;//个数多的在前面。
}
return 0;
}
int main()
{
vector<vector<int>> v(10005);//相当于二维数组。
map<vector<int>, int> ma;
int n, m, k;
cin >> n >> m;
for (int i = 0; i < n; i++)
{
for (int j = 0; j < m; j++)
{
cin >> k;
v[i].push_back(k);
}
ma[v[i]]++;
}
vector<pair<vector<int>, int> > ve(ma.begin(), ma.end());
sort(ve.begin(), ve.end(), cmp);//自定义排序。
cout << ve.size() << endl;
vector<pair<vector<int>, int> >::iterator it = ve.begin();
for (; it != ve.end(); it++)
{
cout << it->second;
for (int i = 0; i < m; i++)
cout << " " << it->first[i];
cout << endl;
}
return 0;
}