堆排序和topK问题

完全二叉树

完全二叉树除了树的最后一层节点不需要是满的,其它的每一层从左到右都是满的。它有以下三个特点:

  • 左孩子index=父节点index * 2 + 1
  • 右孩子index=父节点index * 2 + 2
  • 最后一个非叶子节点编号为index/2

利用最大堆做排序O(nlgn)

初始化最大堆

从最后一个非叶子节点往前遍历,进行堆调整,这里拿{ 49,38,65,97,76,13,27,49,55,04 }举例:
在这里插入图片描述

堆顶元素移除到末尾

堆顶元素是当前list中的最大值,放在末尾即可;
对其余元素进行堆调整,如此循环到第0号元素

#include <iostream>

// 调整最大堆
int adjust_head(int* list, int index, int len)
{
	int l = index * 2 + 1;
	int r = index * 2 + 2;
	int max_index = index;

	if (l < len && list[l] > list[max_index])
	{
		max_index = l;
	}
	if (r < len && list[r] > list[max_index])
	{
		max_index = r;
	}
	if (max_index != index)
	{
		std::swap(list[index], list[max_index]);
		adjust_head(list, max_index, len); // 此时max_index指向的node是index下放下来的,值比较小,需要对此node往下调整
	}
	return 0;
}

int head_sort(int* list, int len)
{
	// 建立堆
	for (int i = len / 2; i >= 0; i--)
	{
		adjust_head(list, i, len);
	}
	// 从堆顶不停取出元素,放在数组后面
	for (int i = len - 1; i >= 0; i--)
	{
		std::swap(list[0], list[i]);
		// 堆调整只对其余i个元素进行
		adjust_head(list, 0, i);
	}
	return 0;
}

int main(int argc, char* argv[])
{
	int list[] = { 49,38,65,97,76,13,27,49,55,04 };
	head_sort(list, 10);
	for (int i = 0; i < 10; i++)
	{
		printf("%d ", list[i]);
	}
	printf("\n");
	return 0;
}

利用最小堆求解topk问题

优点:

  • 时间复杂度O(nlgk)
  • 可以处理超大规模一次无法全部加载入内存的数据
#include <iostream>
#include <vector>

// 调整最小堆
int adjust_head(int* list, int index, int len)
{
   int l = index * 2 + 1;
   int r = index * 2 + 2;
   int min_index = index;

   if (l < len && list[l] < list[min_index])
   {
   	min_index = l;
   }
   if (r < len && list[r] < list[min_index])
   {
   	min_index = r;
   }
   if (min_index != index)
   {
   	std::swap(list[index], list[min_index]);
   	adjust_head(list, min_index, len); // 此时max_index指向的node是index下放下来的,值比较小,需要对此node往下调整
   }
   return 0;
}

// topK question(最小堆)
int main(int argc, char* argv[])
{
   int len = 10;
   int k = 5;
   int list[] = { 49,38,65,97,76,13,27,49,55,4 };

   // 创建堆
   int* myheap = new int[k];
   for (int i = 0; i < k; i++)
   {
   	myheap[i] = list[i];
   }
   // 初始化最小
   for (int i = k / 2; i >= 0; i--)
   {
   	adjust_head(myheap, i, k);
   }
   // 不断更新堆heap,完成topk的查找
   for (int i = k; i < len; i++)
   {
   	if (list[i] <= myheap[0])
   	{
   		continue;
   	}
   	// 如果下一个元素比堆顶大,可以纳入topk,再调整最小堆
   	myheap[0] = list[i];
   	adjust_head(myheap, 0, k);
   }
   for (int i = 0; i < k; i++)
   {
   	printf("%d ", myheap[i]);
   }
   delete myheap;
   printf("\n");
   return 0;
}
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值