题解:Top k问题即在大量数据(n>>100000)中查找前k个最大的数据。
思路:排序是不可取的,因为大量数据排序耗时太大,且空间复杂度也很大,一般利用数据结构的最小堆(最小堆即父节点的值小于等于孩子节点的数值)来处理;
具体做法:建立一个含有K个节点的最小堆,遍历海量数据分别与根节点比较,若小于根节点则舍弃,否则用新数值替换根节点数值,并进行最小堆的调整,那么最终得到的堆节点就是最大的k个数据。
时间复杂度=nlogK(堆调整时间复杂度为logK);
推排序
转:https://blog.csdn.net/YuZhiHui_No1/article/details/44258297
(1)思想
把待排序的元素按照大小在二叉树位置上排列,排序好的元素要满足:父节点的元素要大于等于其子节点;这个过程叫做堆化过程,如果根节点存放的是最大的数,则叫做大根堆;如果是最小的数,自然就叫做小根堆了。根据这个特性(大根堆根最大,小根堆根最小),就可以把根节点拿出来,然后再堆化下,再把根节点拿出来,,,,循环到最后一个节点,就排序好了。