例2.5 Sort(九度教程第11题)
题目
时间限制:1 秒 内存限制:128 兆 特殊判题:否
题目描述:
给你n个整数,请按从大到小的顺序输出其中前m大的数。
输入:
每组测试数据有两行,第一行有两个数n,m(0<n,m<1000000),第二行包含n个各不相同,且都处于区间[-500000,500000]的整数。
输出:
对每组测试数据按从大到小的顺序输出前m大的数。
样例输入:
5 3
3 -35 92 213 -644
样例输出:
213 92 3
解析:
如果使用排序来解决该题,由于待排序数字的数量十分庞大(1000000),即使使用时间复杂度为O(nlogn)的快速排序,其时间复杂度也会达到千万数量级,而这在一秒时限内是不能被所接受的,所以这里并不能使用快速排序来解决本题。
本例与上例有一个共同的特点:输入数量的有限性。该例题面限定了输入的数字一定是[-500000,500000]区间里的整数,且各不相同。若利用一个数组分别统计每一种数字是否出现,其空间复杂度依旧在题目的限定范围内。且统计出现数字当中较大的m个数字,也仅需要从尾至头遍历这个数组,其时间复杂度仍在百万数量级。
由于输入数据中出现了负数,不能直接把输入数据当做数组下标来访问数组元素,而是将每一个输入的数据都加上一个固定的偏移值,使输入数据的[-500000,500000]区间被映射到数组下标的[0,1000000]区间。
代码:
#include<stdio.h>
#define OFFSET 500000 //偏移量,用于补偿实际数字与数组下标之间的偏移
int Hash[1000001]; //Hash数组,记录每个数字是否出现,不出现为0,出现后被标记为1
int main()
{
int n,m;
while(scanf("%d%d",&n,&m)!=EOF){
for(int i=-500000;i<=500000;i++)//初始化,将每个数字都标记为未出现
{
Hash[i+OFFSET]=0;
}
for(int i=1;i<=n;i++)
{
int x;
scanf("%d",&x);
Hash[x+OFFSET]=1;//凡是出现过的数字,该数组元素均被设置成1
}
for(int i=500000;i>=-500000;i--)//输出前m个数
{
if(Hash[i+OFFSET]==1) //若该数字在输入中出现
{
printf("%d",i); //输出该数字
m--; //输出一个数字后,m减一,直至m变成0为止
if(m!=0)
{
printf(" "); //注意格式,若m个数未被输出完毕,在输出的数字后紧跟一个空格
}else{
printf("\n"); //若m个数字已经输出完毕,则在输出的数字后面紧跟一个换行,并跳出循环遍历
break;
}
}
}
}
return 0;
}
对输入数字做了“各不相同”的限定,试问假如去除这一限定,使输入数字可能存在重复,该Hash方法依旧可用,需对代码做部分改动,如下所示:
#include <stdio.h>
#define OFFSET 500000 //偏移量,用于补偿实际数字与数组下标之间偏移
int Hash[1000001]; //Hash数组,记录每个数字是否出现,不出现为0,出现后被标记成1
int main () {
int n , m;
while (scanf ("%d%d",&n,&m) != EOF) {
for (int i = -500000;i <= 500000;i ++) {
Hash[i + OFFSET] = 0;
} //初始化,将每个数字都标记为未出现
for (int i = 1;i <= n;i ++) {
int x;
scanf ("%d",&x);
Hash[x + OFFSET]++; //凡是出现过的数字,该数组元素均被设置成1
}
for (int i = 500000;i >= -500000;i --) { //输出前m个数
while (Hash[i + OFFSET] > 0) { //若该数字在输入中出现
printf("%d",i); //输出该数字
Hash[i + OFFSET]--;
m --; //输出一个数字后,m减一,直至m变为0
if (m != 0) printf(" "); //注意格式,若m个数未被输出完毕,在输出的数字后紧跟一个空格
else {
printf("\n"); //若m个数字已经被输出完毕,则在输出的数字后面紧跟一个换行,并跳出遍历循环
break;
}
}
}
}
return 0;
}