@TOP-K问题(c++实现)
问题描述:
给定一个数组,找出数组中最大的K个数或者最小的K个数,称为top K问题。这是面试的常考题,解法可以是基于最大堆/最大堆排序、基于快速排序实现等等,文本基于快速排序的思想实现。
算法思路:
我们不会采用快速排序的算法来实现TOP-K问题,但我们可以利用快速排序的思想,在数组中随机找一个元素pivot,将数组分成两部分Sa和Sb,其中Sa的元素>=pivot,Sb的元素<pivot,然后分析两种情况:
若Sa中元素的个数大于或等于k,则在Sa中查找最大的k个数
若Sa中元素的个数小于k,其个数为len,则在Sb中查找k-len个数字
如此递归下去,不断把问题分解为更小的问题,直到求出结果。注意,这里递归的原子就是在[a,b]中查找n个数字
该算法的平均时间复杂度为O(N * logk)。以求K大的数为例,算法实现如下:
代码
#include <iostream>
#include <vector>
using namespace std;
//这个和快速排序中的partion是相同的
int partion(vector<int> &a,int left,int right){
int i = left - 1;
int x = a[right-1];
int p = left;
for(int j = p;j<right;j++ ){
if(a[j-1] < x){
i = i + 1;
swap(a[i-1],a[j-1]);
}
}
swap(a[i],a[right-1]);
return i+1;
}
int topk(vector<int> &a,int left, int right, int k){
int index = -1;
if(left < right){
int pos = partion(a,left,right);
int len = right - pos+1;
if(len == k)
index = pos;
else if (len < k){
index = topk(a,left,pos-1,k-len);
}
else {
index = topk(a,pos+1,right,k);
}
}
return index;
}
int main(){
int b[] = {1,8,5,9,6};
vector<int> a(b,b+5);
int l = a.size();
int k =4;
cout << "原数组为:";
for(int i=0;i<l;i++){
cout << a[i] <<" ";
}
cout << endl;
int inde = topk(a,1,l,k);
cout << "TOP-K 为:";
for (int i=inde;i<=l;i++){
cout << a[i-1] <<" ";
}
cout <<endl;
}