问题描述:
在N(0<N<100000)个数中,找出第K(0<k<100000)大的数。
例如:1,2,3,4,5,6,7,8,9 中第3大的数为 7。
输入:
输入有多组数据,处理到文件结束。
每组数据有两行,
第一行包括两个数,一个正整数N和一个正整数K,
第二行有N个正整数。
输出:
对于每组数据,输出一个数,表示第K大的数,并换行。
样例输入:
12 5
12 4 5 98 4 7 32 1 65 0 65 55 99910 3
1 2 3 4 5 6 7 8 9 10
样例输出:
32
8
思路:
求第k大的数是一个经典问题,其实也有很多方法解决。
最容易想到的方法就是,先给这n个数从大到小排序,然后输出第k个数。
这种方法容易想到,但时间复杂度取决于排序算法的复杂度,就算用快速排序也是O(n*logn)。
那么这时候就会想到用其他数据结构。
其中比较好的方法就是用树型结构,通过建立最小堆来处理,时间复杂度会减到为O(n*logk)。
具体的话,只需要建立大小为K的最小堆,然后遍历后续的数,如果这个数比堆顶大,那么就把它当做新的堆顶。
每次添加都维护一下,
那么最后,堆顶就是第K大的数。
举个例子:
假设对于第二个样例:N为10,K为3,十个数是1,2,3,4,5,6,7,8,9,10
第一步,建立一个大小为k的最小堆。对于用哪几个数字建堆中并不重要,所以直接用前k个数建堆就行。这里就是前3个数建立大小为3的最小堆。
建立的最小堆如图所示。
然后,到了第4个数,这时候要与堆顶的数比较,
如果这个数比堆顶的数小,那么这个数就不管,继续遍历下一个数。
如果这个数比堆顶的数大,则舍弃当前堆顶而将这个数作为新的堆顶,并再去维护堆。
就像,这里第4个数是4,那么就将4作为新的堆顶,如图所示:
然后维护这个堆:
然后,用同样的方法处理第5~10个数。
最后,形成的最小堆的堆顶就是答案了。
代码如下:
#include <stdio.h>
int h[100000],n;
void swap(int a, int b)
{
int t;
t = h[a];
h[a] = h[b];
h[b] = t;
}
void siftdown(int i)
{
int t, flag = 0;
while(2*i <= n && flag == 0)
{
if(h[i] > h[2*i])
{
t = 2*i;
}
else
{
t = i;
}
if(2*i + 1 <= n)
{
if(h[t] > h[2*i + 1])
{
t = 2*i + 1;
}
}
if(t != i)
{
swap(i, t);
i = t;
}
else
{
flag = 1;
}
}
}
void creat()
{
for(int i = n/2; i >= 1; i--)
{
siftdown(i);
}
}
int main()
{
int num, maxi, a[100000];
while(scanf("%d %d", &num, &maxi) != EOF)
{
n = maxi;
for(int i = 1; i <= num; i++)
{
scanf("%d", &a[i]);
h[i] = a[i];
}
creat();
for(int i = n + 1; i <= num; i++)
{
if(a[i] > h[1])
{
h[1] = a[i];
siftdown(1);
}
else
{
continue;
}
}
printf("%d\n", h[1]);
}
return 0;
}