topK问题:有 N (N>1000000)个数,求出其中的前K个最小的数。
力扣原题:最小的k个数
输入整数数组 arr ,找出其中最小的 k 个数。
方法一:大顶堆
思路:维护一个大小为k的大顶堆,遍历一次数组,初始插入k个数,然后每遍历一个数,将其与堆顶比较,若比堆顶小,则堆顶弹出,该数入堆
class Solution {
public:
vector<int> getLeastNumbers(vector<int>& arr, int k) {
vector<int>vec(k, 0);
if (k == 0) return vec; // 排除 0 的情况
priority_queue<int>Q;
for (int i = 0; i < k; ++i) Q.push(arr[i]);
for (int i = k; i < (int)arr.size(); ++i) {
if (Q.top() > arr[i]) {
Q.pop();
Q.push(arr[i]);
}
}
for (int i = 0; i < k; ++i) {
vec[i] = Q.top();
Q.pop();
}
return vec;
}
};
时间复杂度:O(nlgk),维护堆花费O(lgk)时间,最坏情况插入n次,维护n次堆。
空间复杂度:O(k),堆大小k。
方法二:快速选择(quickselect)
与快速选择方法几乎完全一样,快速选择选出第k个数时,前k个数就是最小的k个数,正好完成题目的要求。
class Solution {
public:
int partition(vector<int> &a,int l, int r){//一次划分,闭区间[l,r]
swap(a[l],a[l+rand()%(r-l+1)]); //随机化
int j=l,pivot=a[l];
for(int i=l+1;i<=r;i++){
if(a[i]<pivot)
swap(a[i],a[++j]);
}
swap(a[l],a[j]);
return j;
}
void select(vector<int> &a,int l,int r,int k){ //递归
int j=partition(a,l,r);
int k1=k-1; //第k大对应下标k-1,k为数组绝对下标
if(k1==j)
return ;
else if(k1<j)
select(a,l,j-1,k);
else
select(a,j+1,r,k);
}
vector<int> getLeastNumbers(vector<int>& arr, int k) {
if(k!=0) select(arr,0,arr.size()-1,k);
arr.resize(k);//直接在原数组上进行裁剪,也可以另建一个vector
return arr;
}
};
时间复杂度:同quickselect,期望为O(n), 算法导论9.2有证明。
最坏情况下的时间复杂度为 O(n^2)。情况最差时,每次的划分点都是最大值或最小值,一共需要划分 n−1次,而一次划分需要线性的时间复杂度。
空间复杂度:最坏情况下的空间复杂度为 O(n)。最坏情况下需要划分 n 次,即 select 函数递归调用最深 n−1 层,而每层由于需要 O(1) 的空间,所以一共需要 O(n)的空间复杂度。期望递归lgn次,空间复杂度为O(lgn),我也不知道为啥。
其他方法:如果n个数的分布比较均匀,可以用桶排序,O(n)即可完成排序。
————————————————
版权声明:本文为CSDN博主「Owl丶」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/qq_40586164/article/details/105334365