topk--堆排序--小顶堆

【问题描述】

假设需要我们在一堆海量数据中找出排名前k的数据;最好的方法是用最小堆排序,直接用前k个数据建立一个小顶堆,然后遍历剩余的数,

①如果此数<堆顶元素【说明:比k个数中最小的数还要小】,直接跳过此数,遍历下一个数;

②如果此数>堆顶的数,则将此数和堆顶的数交换,然后从堆顶向下调整堆,使其重新满足小顶堆。


【说明】堆的存储

一般用数组来表示堆,第i个节点的父节点下标为i/2-1;它的左右节点下标分别为:2*i+1和2*1+2


【代码】

一、从第i个点向下调整堆的过程

//  从i节点开始向下调整,n为节点总数,从i开始计算 i节点的子节点为 2*i+1, 2*i+2
void MinHeapDown(int a[], int i, int n)
{
    int j, temp;

	temp = a[i];
	j = 2 * i + 1;
	while (j < n)
	{
		if (j + 1 < n && a[j + 1] < a[j]) //在左右孩子中找最小的
			j++;

		if (a[j] >= temp)
			break;

		a[i] = a[j];     //把较小的子结点往上移动,替换它的父结点
		i = j;
		j = 2 * i + 1;
	}
	a[i] = temp;
}

二、 建立最小堆的过程

【说明】从最后一个非叶节点开始,追个进行向下调整操作,保证当前节点的所有子节点是满足最小堆的,然后一直到根节点,保证这个堆是满足小顶堆的

//建立最小堆
void MakeMinHeap(int a[], int n)
{
	for (int i = n / 2 - 1; i >= 0; i--)
		MinHeapDown(a, i, n);
}

三、当来一个新数,需要替换堆顶元素时,替换堆顶元素,然后, 从堆顶元素向下进行一次调整,即可使新堆满足小顶堆

//如果当前值key>堆顶元素,则进行替换操作,然后进行向下调整
void MinHeapReplaceHeader(int a[], int n,int key)
{
	a[0] = key;
	MinHeapDown(a, 0, n);
}


四、遍历完所有数据后,最后剩余在k个节点的小顶堆中的数据即我们所求的top-k;从堆顶进行挨个删除【 堆顶和最后一个元素替换,进行输出】;然后重新向下调整堆,直到所有数据都输出完,结束

void MinHeapDeleteNumber(int a[], int n)  
{  for(int i=n-1;i>=0;i--){
         //每次输出一个最小值后的调整过程
         Swap(a[0], a[i]);  
         MinHeapDown(a, 0, i);  
    }
    //进行遍历,输出最终k个值的过程
    for(int i=n-1;i>=0;i--)
         printf("%d ",a[i]);
}  

堆排序的时间复杂度为O(N*logN)


【话外音】

当然,若数据不是很大,也可以用快排先进行排序,然后直接输出前k个最大的数;数据量大的情况下,不提倡排序


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值