寻找前K大数

寻找前K大数虽然这个问题已经被做烂了,但是无意中看到之前A题时候的一个代码,还是忍不住改了改想提高下效率,从O(NlogN)降到O(N+KlogK)。


Problem Description
浙江桐乡乌镇共有n个人,请找出该镇上的前m个大富翁.
 

Input
输入包含多组测试用例.
每个用例首先包含2个整数n(0<n<=100000)和m(0<m<=10),其中: n为镇上的人数,m为需要找出的大富翁数, 接下来一行输入镇上n个人的财富值.
n和m同时为0时表示输入结束.
 

Output
请输出乌镇前m个大富翁的财产数,财产多的排前面,如果大富翁不足m个,则全部输出,每组输出占一行.
 

Sample Input
3 1 2 5 -1 5 3 1 2 3 4 5 0 0
 

Sample Output
5 5 4 3


当时用的是很简单的冒泡和sort,恩,也就是对数组全部元素排序,复杂度O(NlogN), 但是当K很小时,比如题目中K<=10的情况无疑浪费了。因此用quicksort的思路,每次将数组partition成两部分,一边<key,一边>key。然后迭代地找前k大数。


code:

//
//  k_biggest_num.c
//  ACM
//  Find the k biggest number in an array
//
//  Created by Rachel on 14-2-13.
//  Copyright (c) 2014年 ZJU. All rights reserved.
//

#include <iostream>
#include <algorithm>
#include <stdio.h>
#include <functional>
#include <utility>
using namespace std;
#define N 100010
#define K 11
typedef int DT;//datatype: DT
DT A[N];
DT kbig[K];
DT partition_r[N],partition_l[N];

void swap(DT* a, DT* b)
{
    DT t = *a;
    *a = *b;
    *b = t;
}

pair<int,int> findKbig(int left, int right, int k)
{
    int l = left, r = right, m = (l+r)/2;
	DT key = A[m];
	while(l<=r)
	{
		while(A[l]<key) l++;
		while(A[r]>key) r--;
		if(l<=r) 
		{
			swap(&A[l],&A[r]); l++; r--;
		}
	}
	/*
	for(int i = left; i<=right; i++)
		cout<<A[i]<<" ";
	cout<<endl;
	*/

	int n = right-l+1; //#elements > key
	pair<int, int> lr = make_pair(l,right);
	if(right-left+1==k)
	{
		lr.first = left;
		return lr;
	}
	else if(n==k)
		return lr;
	else if(n>k)
		return findKbig(l,right,k);
	else
	{
		lr.first = findKbig(left,l-1,k-n).first;
		return lr;
	}
}

int main()
{
    int i,n,k;
    while (true) {
        cin>>n>>k;
        
        if (n==0 && k==0) {
            break;
        }
        k = k>n?n:k;
        for (i=0; i<n; i++) {
            cin>>A[i];
        }
        pair<int,int> P = findKbig(0,n-1,k);
		int l = P.first, r = P.second;
		DT res[K];
		memset(res,0,sizeof(res));
		for(i = l; i<=r ; i++)
			res[i-l] = A[i];
        sort(res, res+K,greater<int>());
        for (i = 0; i<k-1; i++) {
            cout<<res[i]<<" ";
        }
        cout<<res[i]<<endl;
    }
    return 0;
}

some typical testing samples:

6 3

2 4 6 9 1 2


10 3

2 3 4 1 53 23 52 32 32 32


4 2

24 34 24 24


5 6

1 2 3 4 5


5 3 

5 3 1 4 2


5 3

1 2 1 1 1


5 3

1 2 3 4 5


10 4

2 5 3 6 2 7 8 7 4 3



---------------------------------------------------

复杂度:

假设每次partition砍掉一半,则

T(N) = T(N/2) + N

 = T(N/4) + N + N/2

 = ...

 = T(1) + N + N/2 + N/4 + ...


∴T(N) = N + N/2 + N/4 + ... = 2N


再对选出元素排序:O(KlogK)

所以复杂度O(N+KlogK).




法2. 最小堆(size = k)

复杂度O(nlogk)

//
//  k_biggest_num.c
//  ACM
//  Find the k biggest number in an array
//
//  Created by Rachel on 14-2-16.
//  Copyright (c) 2014年 ZJU. All rights reserved.
//

#include <iostream>
#include <algorithm>
#include <stdio.h>
#include <functional>
#include <utility>
using namespace std;
#define N 100010
#define K 12
typedef int DT;//datatype: DT
DT kbig[K];//minheap

inline void swap(DT* a, DT* b)
{
    DT t = *a;
    *a = *b;
    *b = t;
}

void AdjustHeap(int idx, int k)
{
	int left = idx*2+1;
	int right = idx*2+2;
	int pos; // the position of smaller child
	if(left>k-1) return;
	else if(right>k-1) pos = left;
	else pos = kbig[left]<kbig[right]?left:right;

	if(kbig[pos]<kbig[idx])
	{
		swap(&kbig[pos],&kbig[idx]);
		AdjustHeap(pos,k);
	}	
}

void BuildHeap(int k)
{
	int nonleaf_idx = (k-2)/2;
	for (int i = nonleaf_idx; i>=0; i--)
		AdjustHeap(i,k);
}

int main()
{
    int i,n,k,tmp;
    while (scanf("%d%d",&n,&k)!=EOF) {
        
        if (n==0 && k==0)
            break;

        k = k>n?n:k;
        for (i=0; i<k; i++)
			scanf("%d",&kbig[i]);
		BuildHeap(k);
		for (i=k; i<n; i++)
		{
			scanf("%d",&tmp);
			if(tmp>kbig[0])
			{
				kbig[0] = tmp;
				AdjustHeap(0,k);//top-down adjust
			}
		}
		sort(kbig,kbig+k,greater<int>());
        for (i = 0; i<k-1; i++)
			printf("%d ",kbig[i]);
        cout<<kbig[i]<<endl;
    }
    return 0;
}




谢谢Swordholy和xindoo的纠错~


关于Algorithms更多的学习资料将继续更新,敬请关注本博客和新浪微博Rachel Zhang




阅读更多
文章标签: 算法 ACM
个人分类: C/C++ ACM Data Structure
上一篇R语言 基本数据分析
下一篇最短路径数 Dijkstra+dfs
想对作者说点什么? 我来说一句

没有更多推荐了,返回首页

关闭
关闭
关闭