2021天梯L2-3 清点代码库

L2-3 清点代码库 (25 分)

上图转自新浪微博:“阿里代码库有几亿行代码,但其中有很多功能重复的代码,比如单单快排就被重写了几百遍。请设计一个程序,能够将代码库中所有功能重复的代码找出。各位大佬有啥想法,我当时就懵了,然后就挂了。。。”

这里我们把问题简化一下:首先假设两个功能模块如果接受同样的输入,总是给出同样的输出,则它们就是功能重复的;其次我们把每个模块的输出都简化为一个整数(在 int 范围内)。于是我们可以设计一系列输入,检查所有功能模块的对应输出,从而查出功能重复的代码。你的任务就是设计并实现这个简化问题的解决方案。

输入格式:

输入在第一行中给出 2 个正整数,依次为 N(≤104)和 M(≤102),对应功能模块的个数和系列测试输入的个数。

随后 N 行,每行给出一个功能模块的 M 个对应输出,数字间以空格分隔。

输出格式:

首先在第一行输出不同功能的个数 K。随后 K 行,每行给出具有这个功能的模块的个数,以及这个功能的对应输出。数字间以 1 个空格分隔,行首尾不得有多余空格。输出首先按模块个数非递增顺序,如果有并列,则按输出序列的递增序给出。

注:所谓数列 { A1​, ..., AM​ } 比 { B1​, ..., BM​ } 大,是指存在 1≤i<M,使得 A1​=B1​,...,Ai​=Bi​ 成立,且 Ai+1​>Bi+1​。

输入样例:

7 3
35 28 74
-1 -1 22
28 74 35
-1 -1 22
11 66 0
35 28 74
35 28 74

输出样例:

4
3 35 28 74
2 -1 -1 22
1 11 66 0
1 28 74 35

 代码

// cread 2022/4/22
//  HJQ
//  topic
/*
7 3
35 28 74
-1 -1 22
28 74 35
-1 -1 22
11 66 0
35 28 74
35 28 74

*/
#include<bits/stdc++.h>
using namespace std;
#define Fast_io  ios::sync_with_stdio(false), cin.tie(0), cout.tie(0)//可以加快速度
map<vector<int>, int> mp;
vector<pair<vector<int>,int>> vv;
bool cmp(pair<vector<int>,int> pa,pair<vector<int>,int> pe)
{
	if(pa.second!=pe.second)
		return pa.second>pe.second;
	else
		return pa.first<pe.first;
}
int main()
{
	int N,M;
	cin>>N>>M;
	for(int i=0; i<N; i++)
	{
		vector<int> ve;
		for(int j=0; j<M; j++)
		{
			int num;
			cin>>num;
			ve.push_back(num);
		}
		mp[ve]++;// 统计出现的次数
	}
	for(auto it=mp.begin(); it!=mp.end(); it++)//把内容和次数统一在一起
	{
		vv.push_back(make_pair((*it).first,(*it).second));
	}
	sort(vv.begin(),vv.end(),cmp);//排序
	cout<<vv.size()<<endl;
	for(auto it=vv.begin(); it!=vv.end(); it++)
	{
		cout<<(*it).second;
		for(int i=0; i<M; i++)
		{
			cout<<" "<<(*it).first[i];
		}
		cout<<endl;
	}
	return 0;
}

别人写的代码,有一个关于set内部排序的特殊知识

#include<bits/stdc++.h>
using namespace std;
int n,m;
set<vector<int> > s;
map<vector<int> , int> mp;
struct cmp {
    bool operator() (const pair<vector<int> ,int> &a, const pair<vector<int>, int> &b) 
	const{
		if(a.second!=b.second){
            return a.second>b.second;
        }else{
            return a.first<b.first;
        }
	}
};
set<pair<vector<int>,int> ,cmp> List;
int main()
{
    cin>>n>>m;
    for(int i = 0;i<n;i++){
        vector<int> temp;
        for(int j=0;j<m;j++){
            int x;
            cin>>x;
            temp.push_back(x);
        }
        s.insert(temp);
        mp[temp]++;
    }
    cout<<s.size()<<endl;
    for(auto it = s.begin();it!=s.end();it++){
        List.insert({*it,mp[*it]});
    }
    for(auto it = List.begin();it!=List.end();it++){
        cout<<(*it).second;
        for(int i=0;i<(*it).first.size();i++){
            cout<<" "<<(*it).first[i];
        }
        cout<<endl;
    }
    return 0;
}

感悟

该题并不难,但对于我来说,知识点在vector的内部的运用,以及set容器的内部排序的转换

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
题目描述 给定一个代码,每个代码文件都有一个唯一的文件名和一个文件路径。文件路径是一个字符串,由斜杠分隔的目录名称组成。例如,/usr/local/include/stdio.h 表示文件 stdio.h 位于目录 /usr 下的子目录 local 中的 include 目录中。 现在,给定一组查询,每个查询包含一个文件路径和一个整数 K,请你统计这个路径下所有文件中,代码行数不少于 K 的文件数量。 输入格式 第一行包含两个整数 N 和 M,分别表示代码文件数量和查询数量。 接下来 N 行,每行描述一个代码文件,格式如下: 文件名 文件路径 代码行数 其中文件名和文件路径均不含空格,且文件路径以斜杠 / 开头,且不以斜杠结尾,代码行数是一个不超过 100 的正整数。 接下来 M 行,每行描述一个查询,格式如下: 文件路径 K 同样,文件路径以斜杠 / 开头,且不以斜杠结尾,K 是一个不超过 100 的正整数。 输出格式 对于每个查询,输出一个整数表示答案,每个答案占一行。 数据范围 1≤N≤10000, 1≤M≤100 输入样例1: 3 2 a.cpp /home/user/a 10 b.cpp /home/user/b 20 c.cpp /home/user/a 30 /home/user/a 15 /home/user/b 15 输出样例1: 1 1 输入样例2: 3 2 a.cpp /home/user/a 10 b.cpp /home/user/b 20 c.cpp /home/user/a 30 /home/user/a 25 /home/user/b 15 输出样例2: 1 算法1 (哈希表) $O(n)$ 时间复杂度 参考文献 python3 代码 C++ 代码 算法2 (暴力枚举) $O(n^2)$ blablabla 时间复杂度 参考文献 C++ 代码
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值