TopK问题
gitee上有更详尽的代码:堆 + TopK代码
topk
问题就是取n
个数据中,找出最大/最小的前k个数
一、问题分析
1. 方法一
对n
个数据进行排序,再取出前k
个元素
- 时间复杂度:
O(N * logN)
2. 方法二
将n
个数据依次插入大堆
,然后pop堆的根 k 次
- 时间复杂度:
O(N + k * logN)
设有n个数据,有log2(n + 1)层,最坏的情况就是每个数据要向上调整k次
3. 方法三
如果n很大,内存中无法储存,插入堆和排序的方法都不行
-
用前
K
个数建立一个K个数的小堆 -
剩下的
N-K
个数,依次跟堆顶的数据进行比较如果比堆顶数据大,就替换堆顶的数据,再向下调整 -
最后堆里面
K
个数就是最大的K
个数
原理:
在方法二的基础上,大堆实现不了,但小堆却能很好的实现
小堆的优点就是,根是堆中所有元素中最小的元素,我们建立一个小堆,可以存放k
个数,后面n-k
个数字再与之比较,这样就能把小数pop出来,把大数push进去
可能会担心:
-
如果小堆里正好都是我们想要的数怎么办?
那与之比较的
n-k
的数肯定没有比根更大的数了 -
如果这里小堆换成大堆?
那可能根是最大的数字,没法操作了。小的话放进去,那如果不是前k个大的数字就进去了,乱套了
时间复杂度:O(k + (n-k)*logk)
二、TopK实现
本篇在上一章:【数据结构】堆_Rinne’s blog-CSDN博客
写了几个二叉树常用的插口
gitee上有更详尽的代码:堆 + TopK代码
1. 前k个数的小堆
//定义和初始化堆
Heap hp;
HeapInit(&hp);
int i = 0;