【数据结构与算法】寻找最大的K个数

最新推荐文章于 2018-02-28 14:03:46 发布

mick_seu

最新推荐文章于 2018-02-28 14:03:46 发布

阅读量1.8k

点赞数 1

分类专栏：数据结构与算法文章标签：快速排序堆排序排序算法最大K个数

本文链接：https://blog.csdn.net/woxiaohahaa/article/details/51271934

版权

数据结构与算法专栏收录该内容

21 篇文章 2 订阅

订阅专栏

腾讯一面遇到这个题，发现这个题真的是比较经典，打算在这里好好总结一下。

参考自师姐的博文：http://blog.csdn.net/xiaxia__/article/details/44965455（XIAXIA_的专栏）

题目简介：

有很多无序的数，我们姑且假定他们各不相等，怎么选出其中最大的K个数呢？

解法一：直接排序

第一反应，假设有N个数，我们使用一个N个长度的数组将其存储下来，并且使用排序算法将其从大到小依次排列。排序完成后，输出前K个数。如果N不小，但是也不大，比如几千什么的，可以采用快速排序来完成。

复杂度分析：
快速排序平均的复杂度为O(NlogN)。

解法二：部分排序

简单分析一下，我们就能发现解法一的一个明显不足之处，那就是我们将所有的元素都进行了排序，而题目要求只是寻找最大的K个数，也就是说我们只要将最大的K个数排好序就好了，没必要将剩下的N-K个数也进行排序。

在这里，我们可以使用快速排序来完成这个部分排序的功能。在快速排序中，每一轮都需要选定一个pivot，每一轮排序完成后，比pivot大的数都排在它前面，而比pivot小的数都排在它的后面。假设前面的序列为Sa，后面的序列为Sb，Sa的长度为n。

此时有三种情况：

1）当n>K时，我们直接输出Sa的前K个元素就好了；
2）当n=K时，我们直接输出Sa这个序列；
3）当n<K时，我们就需要从Sb中找出K−n个元素和Sa一起输出就好了。

完整测试代码如下：

#include <iostream>  
#include <ctime>
#include <cstdlib>
using namespace std;  

void kBig(int *pArray, int low, int high, int K);
int partion(int *pArray, int low, int high);

int main()  
{  
	srand((unsigned)time(NULL));
   	int data[50];
	int K = 3, i;

	for(i = 0; i < 50; i++)
	{
		data[i] = rand() % 200;
		cout << data[i] << " ";
	}
	cout << endl;

        kBig(data, 0, 50 - 1, K);
	for (i = 0; i < K; i++)
            cout << data[i] << endl;

	return 0;
}  

//将前K大个数移到数组前K个位置上
void kBig(int *pArray, int low, int high, int K)
{
    int index, n;
    if (low <= high)
    {
        //对数组进行划分，并返回划分的位置
        index = partion(pArray, low, high);
        n = index - low + 1;     			        //Sa的个数
        
	if (n == K)     				        //如果恰好是K个的话，那么返回
            return;
        
	if (n < K)     						//如果Sa的个数不够的话，那么再从Sb中找K-n个
            kBig(pArray, index + 1, high, K - n);

        if (n > K)     						//如果Sa的个数大于K的话，那么就从Sa里面返回K个
            kBig(pArray, low, index, K);
    }
}

//快速排序的划分函数并返回pivot的坐标
int partion(int *data, int left, int right)
{
	if(left >= right)
		return left;

	int pivot;
	pivot = data[left];
	while(left < right)
	{

		while(right > left && data[right] <= pivot)
			right--;
		data[left] = data[right];

		while(right > left && data[left] >= pivot)
			left++;
		data[right] = data[left];
	}	
	data[left] = pivot;

    return left;
}

复杂度分析：

复杂度为O(N)。

解法三：堆排序

如果N是一个较大的数，那用这么大的数组来存储并进行快排，这就是非常不明智地做法了。此时我们可以使用一个大小为K的最小堆来完成。完整测试代码如下：

#include <iostream>  
#include <ctime>
#include <cstdlib>
using namespace std;  

void PercDown(int *data, int i, int N)
{
	int tmp, child;
	child = i << 1;
	for(tmp = data[i]; child <= N;)
	{
		if(child + 1 <= N && data[child + 1] < data[child] )
			child++;
		if(data[child] >= tmp)
			break;
		
		data[i] = data[child];
		i = child;
		child = i << 1;
	}
	data[i] = tmp;
}

void BuildHeap(int *data, int N)
{
	int i;
	for(i = N / 2; i > 0; --i)
		PercDown(data, i, N);
}

int main()  
{  
	srand((unsigned)time(NULL));
   	int data[50];
	int sortheap[11] = {0};
	int K = 10, i;

	for(i = 0; i < 50; i++)
	{
		data[i] = rand() % 200;
		if(i < 10)
			sortheap[i + 1] = data[i];
		cout << data[i] << " ";
	}
	cout << endl;

	BuildHeap(sortheap, 10);                                 //建立大小为K的最小堆
	for(i = 10; i < 50; ++i)
	{
		if(data[i] > sortheap[1])                        //遍历剩下的元素，如果大于根节点就赋值到根节点，然后下滤
		{
			sortheap[1] = data[i];
			PercDown(sortheap, 1, 10);
		}
	}

	for (i = 1; i < 11; i++)
        cout << sortheap[i] << " ";
	cout << endl;
	
	return 0;
}

复杂度分析：O(NlogK)可以看到堆排序这种做法并没有怎么提高时间复杂度，但是却极大的降低了对空间的存储要求，只需要维护一个K大小的堆。

对于堆排序，需要牢记的是下滤(PercDown) 这个函数，有了这个函数，我们可以轻易实现 BuildHeap，DeleteMin的操作。此外，PercDown 这个函数还很契合我们当前的这个用法。

解法四：计数排序法

适用情况：如果所有N个数都是正整数，且他们的取值范围不大，我们知道最大的数是MAXN。那么我们可以申请一个数组count[MAXN] 来记录每个数出现的次数。然后我们就可以找出最大的K个数。

复杂度:O(N)