堆的定义
堆的定义如下:
- 堆树是一颗完全二叉树;
- 堆树中某个节点的值总是不大于或不小于其孩子节点的值;
- 堆树中每个节点的子树都是堆树.
当父节点的键值总是大于或等于任何一个子节点的键值时为最大堆.当父节点的键值总是小于或等于任何一个子节点的键值时为最小堆.如下图,左边为最大堆,右边为最小堆.
堆树的操作
以最大堆为例,最小堆同理.
构造最大堆
原始数据为a[] = {4, 1, 3, 2, 16, 9, 10, 14, 8, 7},采用顺序存储方式,对应的完全二叉树如下图所示:
构造最大堆
从底而上,一层层地不断基于父节点构造最大堆,直至到达根节点完成整个最大堆的构造.
如下图所示,最后一个节点为7,其父节点为16,从16这个节点开始构造最大堆;构造完毕之后,转移到下一个父节点2,直到所有父节点都构造完毕.
伪代码
堆排序
构造最大堆或最小堆的过程就是推排序.在TopK问题中,如果选择出的K个top值不需要排序,则可以用对排序来降低算法复杂度.
堆排序找出TopK
问题描述:
从arr[1, n]这n个数中,找出最大的k个数,这就是经典的TopK问题。
举例:
从arr[1, 12]={5,3,7,1,8,2,9,4,7,2,6,6} 这n=12个数中,找出最大的k=5个。
思路: 只找到TopK,不排序TopK.
时间复杂度:O(n*lg(k))
参考: