我实现的代码,下面是转载别人的
void swap(int &n1, int &n2)
{
int temp = n1;
n1 = n2;
n2 = temp;
}
/*
int i 起始下标
int N 从i开始的元素个数
*/
void ELementDown(int A[], int i, int N)
{
for(int index = 2 * i + 1; index < N; index = 2 * index + 1)
{
//child=N-1,即child是最大下标,只有左子树
//index左子节点序号 n - 2 右子节点最后一个n - 1
if(index < N - 1 && A[index] > A[index + 1])
{
index++;
}
if(A[i] > A[index])
{
int tmp = A[i];
A[i] = A[index];
A[index] = tmp;
//交换后继续比较
i = index;
}
else
{
break;
}
}
}
//堆排序
void HeapSort(int A[], int N)
{
//N个节点,最后一个非叶子节点编号=(N-2)/2
//步骤一:创建小根堆
for(int i = (N - 2) / 2; i >= 0; --i)
{
ELementDown(A, i, N);
}
//步骤二:调整小根堆
for(int i = N - 1; i > 0; i--)
{
swap(A[0], A[i]);
ELementDown(A, 0,i);
}
}
void GetLastSmallNum(int A[], int N)
{
for(int i = N - 1; i > 0; i--)
{
swap(A[0], A[i]);
HeapSort(A, i);
}
}
#include<stdio.h>
int main()
{
int A[6] = {4,5,3,2,6,1};
//HeapSort(A, 6);
//N个节点,最后一个非叶子节点编号=(N-2)/2
//步骤一:创建小根堆
for(int i = (6 - 2) / 2; i >= 0; --i)
{
ELementDown(A, i, 6);
}
int tmp;
scanf("%d",&tmp);
if(tmp > A[0])
{
A[0] = tmp;
ELementDown(A, 0, 6);
}
return 1;
}
问题描述:有N(N>>10000)个整数,求出其中的前K个最大的数。(称作Top k或者Top 10)
问题分析:由于(1)输入的大量数据;(2)只要前K个,对整个输入数据的保存和排序是相当的不可取的。
可以利用数据结构的最小堆来处理该问题。
最小堆如图所示,对于每个非叶子节点的数值,一定不大于孩子节点的数值。这样可用含有K个节点的最小堆来保存K个目前的最大值(当然根节点是其中的最小数值)。
每次有数据输入的时候可以先与根节点比较。若不大于根节点,则舍弃;否则用新数值替换根节点数值。并进行最小堆的调整。
实现代码以及说明:
#include<stdio.h> int n; ///数字个数,n很大(n>10000) int dui[10]; #define K 10 ///Top K,K的取值 void create_dui(); ///建堆 void UpToDown(int); ///从上到下调整 int main() { int i; int tmp; while(scanf("%d",&n)!=EOF) { for(i=1;i<=K;i++) ///先输入K个 scanf("%d",&dui[i]); create_dui(); ///建小顶堆 for(i=K+1;i<=n;i++) { scanf("%d",&tmp); if(tmp>dui[1]) ///只有大于根节点才处理 { dui[1]=tmp; UpToDown(1); ///向下调整堆 } } } return 1; } void create_dui() { int i; int pos=K/2; ///从末尾数,第一个非叶节点的位置K/2 for(i=pos;i>=1;i--) UpToDown(i); } void UpToDown(int i) { int t1,t2,tmp,pos; t1=2*i; ///左孩子(存在的话) t2=t1+1; ///右孩子(存在的话) if(t1>K) ///无孩子节点 return; else { if(t2>K) ///只有左孩子 pos=t1; else pos=dui[t1]>dui[t2]? t2:t1; if(dui[i]>dui[pos]) ///pos保存在子孩子中,数值较小者的位置 { tmp=dui[i];dui[i]=dui[pos];dui[pos]=tmp; UpToDown(pos); } } }
由于仅仅保存了K个数据,有调整最小堆的时间复杂度为O(lnK),因此TOp K算法(问题)时间复杂度为O(nlnK).