堆是一种很有趣的数据结构,有最大堆和最小堆两种形式,在上一篇文章里已经讲到了最大最小堆的建立;
这里用一下堆的方法解决问题。
1.首先是在一大堆数字中找到K个最大或最小的数字(topK问题)
topK问题是生活中很常见的问题;比如找到N个在某个科目成绩最好的同学,或者在很多游戏中都会有很多数据分析结果,年度评价之列的都是什么游戏时间最长啦,与你开黑时间最多的K个小伙伴啦,都会用到。
若是用普通的方式遍历所有元素,让元素个数很大,几亿或者几十亿,每次遍历出一个数都要比较K个数,则时间复杂度为N*K,K个数有序的话这个复杂度会少,但是排一个序也需要很多时间复杂度。所以这里可以利用堆最大K个数我们可以用这K个数组成一个最小堆(最小堆算的上是一个不完整的排序),堆顶则是这K个数中最小的数,新来的数只要比这K个数中最小的大即可入堆;再次调整堆,消耗的时间复杂度也不高(lg K)。所以使用堆求TopK 时间复杂度只有 O(K*lgK)。