L2-3 清点代码库(补题记录)
上图转自新浪微博:“阿里代码库有几亿行代码,但其中有很多功能重复的代码,比如单单快排就被重写了几百遍。请设计一个程序,能够将代码库中所有功能重复的代码找出。各位大佬有啥想法,我当时就懵了,然后就挂了。。。”
这里我们把问题简化一下:首先假设两个功能模块如果接受同样的输入,总是给出同样的输出,则它们就是功能重复的;其次我们把每个模块的输出都简化为一个整数(在 int 范围内)。于是我们可以设计一系列输入,检查所有功能模块的对应输出,从而查出功能重复的代码。你的任务就是设计并实现这个简化问题的解决方案。
输入格式
输入在一行中给出2个整数,依次为N(<=104)和M(<=102),对应功能模块的个数和系统测试输入的个数。
随后N行,每行给出一个功能模块的M个对应输出,数字间以空格分离。
输出格式
首先在第一行输出不同功能的个数 K。随后 K 行,每行给出具有这个功能的模块的个数,以及这个功能的对应输出。数字间以 1 个空格分隔,行首尾不得有多余空格。输出首先按模块个数非递增顺序,如果有并列,则按输出序列的递增序给出。
注:所谓数列{A1,…AM}比{B1,…,BM}大,是指存在1<=i<M,使得A1 = B1, …, Ai = Bi成立,且Ai+1 > Bi+1。
输入样例
7 3
35 28 74
-1 -1 22
28 74 35
-1 -1 22
11 66 0
35 28 74
35 28 74
输出样例
4
3 35 28 74
2 -1 -1 22
1 11 66 0
1 28 74 35
解题思路
21年的天梯赛,这道题是一个“简单题”,通过题目易知只需要将所给序列去重排序后就能AC了。我刚开始的思路是,去重用set,统计个数用mp<string, int>。比赛时我就是将序列当作字符串进行统计,当时没理解数量相同时按序列大小递增输出是啥意思,再加上对map不熟练,只得17分。下来补题时才明白了序列大小是啥意思,起初比较序列大小时是将字符串转化成数组再来比较,发现会超时,后来通过看别人AC代码才发现竟然可以用vector直接比较序列大小(比较规则是从前往后遍历每一个元素,返回第一个不相等的元素的比较结果),啊这(我直接一个拖鞋甩出题人脸上),这不明摆着欺负我们这些小白嘛。好了AC思路:用map<vector, int>存模块数量,然后将模块和数量用结构体来存并装入一个vector中,这里用结构体数组的话会超时,重载排序规则。最后输出。
(代码包含的知识还有很多没懂,先呈上)
AC代码
#include <bits/stdc++.h>
using namespace std;
const int N = 1e4+9;
map<vector<int>, int>mp;//存模块和数量
struct node
{
vector<int>v;
int cnt;
bool operator < (const node x) const
{
if(cnt == x.cnt) return v < x.v;
return cnt > x.cnt;
}
};
vector<node>ans;
int main()
{
int n, k;
cin >> n >> k;
vector<int>vv;
for(int i = 0;i < n;i ++)
{
for(int j = 0;j < k;j ++)
{
int pre;
cin >> pre;
vv.push_back(pre);
}
if(mp.count(vv)) mp[vv] ++;
else mp[vv] = 1;
vv.clear();
}
for(map<vector<int>, int>::iterator it = mp.begin();it != mp.end();it ++)
{
ans.push_back({it->first, it->second});
}
sort(ans.begin(), ans.end());
cout << mp.size() << '\n';
for(vector<node>::iterator it = ans.begin();it != ans.end();it ++)
{
node no = *it;
cout << no.cnt << ' ';
for(vector<int>::iterator j = no.v.begin();j != no.v.end();j ++)
{
cout << *j;
if(j != no.v.end()-1) cout << ' ';
}
if(it != ans.end()-1) cout << '\n';
}
return 0;
}
时间:2021/4/30