100w个数中找出最大的k个数

原创 2016年06月05日 17:46:47

题目:100w个数中找出最大的k个数

1.思路1:我们应该首先想到是先将100w个数排序,暂且不考虑效率问题,可是内存中能放得下吗?
2.思路2:堆排序,先从中去k个数进行堆排,然后一个一个数进行比较替换,每替换一次都得将堆下调一次,去保证堆得特性;

函数FindMaxKNum():俩件事;一、取k个数进行建堆;二、进行数据替换,替换完一次下调一次,保证堆的特性;
函数AdjustDown():将堆进行下调;算法:先找到堆得最后一个叶子结点父亲;即((k-1)-1)/2;

代码如下:

<span style="font-size:18px;">#include<iostream>
#include<assert.h>
using namespace std;

//向下调整
void AdjustDown(int* arr, int len, int root)
{
	int child = root * 2 + 1;
	while (child < len)
	{
		if (child + 1 < len && arr[child] > arr[child + 1])
			++child;
		if (arr[child] < arr[root])
		{
			swap(arr[child], arr[root]);
			root = child;
			child = root * 2 + 1;
		}
		else
		{
			break;
		}
	}
}

void Print(int* arr, int len)
{
	assert(arr);
	assert(len > 0);
	for (int i = 0; i < len; ++i)
	{
		cout << arr[i] << " ";
	}
	cout << endl;
}

//100w中找出最大的前k个数
void FindMaxKNum(int* arr, int n,int k)
{
	assert(arr);
	assert(n > 0 && k > 0);

	int* heap = new int[k];
	
	int i = 0;
	//取k个数
	for (; i < k; ++i)
	{
		heap[i] = arr[i];
	}
	//建堆,找最大的k个数,建小堆
	i = k;
	for ((i - 2) / 2; i >= 0; --i)
	{
		AdjustDown(heap, k, i);
	}

	//替换数据,并下调数据,使得堆保持它的特性
	for (i = k; i < n; ++i)
	{
		if (heap[0] < arr[i])
		{
			heap[0] = arr[i];
			AdjustDown(heap, k, 0);
		}
	}

	Print(heap, k);
	delete[] heap;
}

void TestFindMaxKNum()
{
	int* arr = new int[1000000];
	int i = 0;
	for (; i < 1000000; ++i)
	{
		arr[i] = i;
	}
	arr[0] = 999999;
	arr[1] = 999999;
	arr[2] = 999999;
	FindMaxKNum(arr, 1000000, 100);
	delete[] arr;
}</span>
测试结果如下图





100w个数中找出最大的前K个数

100w个数中找出最大的前K个数这个题是堆应用。 首先100万个数大约占4M内存,可以加载到内存中。我们可以采用排序解决这个问题,比如堆排序、快排等,但排序不是最优解。我们可以利用最小堆来解决这个问题...

N个数中找出最大的K个数

题目描述: 有很多个(N个)无序的数,我们姑且假定它们各不相等,怎么选出其中最大的若干个(k个)数呢? 1.N=100, K = 10的时候怎么处理? 2. N=1000, K = 100呢? ...

【海量数据处理】N个数中找出最大的前K个数

N个数中找出最大的前K个数,需要用小堆实现。分析:由于小堆的堆顶存放堆中最小的数据,可以通过与堆顶数据进行比较,将大数据存放在堆中,注意在每次改变堆顶数据后,进行调堆,使堆顶一直存放整个堆中最小元素。...
  • Scenlyf
  • Scenlyf
  • 2016年06月11日 18:53
  • 201

N个数里面找出最大的k个数

题目:给出N个无序的数,然后找出其中最大的k个数 解题思路:          首先测试数据有可能会有一亿个数,数据量特别的大,数据库不可能存储这么多的数据。如果直接sort排序,NlogN时间复...

从100W个数中最快找出两个相同的数

#include #include #include using namespace std; /* * 从100W个数中最快找出两个相同的数 */ // 从set容器中查找 ...
  • satanzw
  • satanzw
  • 2012年10月21日 15:37
  • 908

百度面试题:在100w个数中找最大的前100个数

在100w个数中找最大的前100个数 答案在文章评论部分,请注意查看:) 原文网址:http://hi.baidu.com/mianshiti/blog/item/37652f27a3ac43...
  • cynhafa
  • cynhafa
  • 2011年09月26日 10:36
  • 5321

在100W个数中获得最大/小的50个数

前年有个朋友在南大考研复试时被老师一个题目问住了,“如何在100W个数中选最大/小的50个?”当时他的回答是快速排序。那么快排的平均比较次数是m*nlogn(log以2为底,m是个常数),所以总共的比...

海量数据处理 - 10亿个数中找出最大的10000个数(top K问题)

前两天面试3面学长问我的这个问题(想说TEG的3个面试学长都是好和蔼,希望能完成最后一面,各方面原因造成我无比想去鹅场的心已经按捺不住了),这个问题还是建立最小堆比较好一些。         先拿1...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:100w个数中找出最大的k个数
举报原因:
原因补充:

(最多只允许输入30个字)