一 TopK
原文链接:
https://blog.csdn.net/z50L2O08e2u4afToR9A/article/details/82837278
TopK——求前K个最大或最小的数。
- 全局排序:前K个数一目了然。
- 局部排序:只需要得到前K个数,没必要对数据进行全局排序,故可使用冒泡排序,只排序前K个数,每冒泡一次就得到一个最大值。时间复杂度为:O(n*k)
- 堆:若只需得到前K个数,而不考虑对这K个数进行排序,则可以借助堆进行求解TopK问题。
即:
找最大的前K个数,则建立一个小堆。
找最小的前K个数,则建立一个大堆。 - 分治法:每个区间“都要”递归排序,例如:快速排序,O(n*lg(n))
- 减治法,“只要”递归排序一个区间,例如:二分查找O(lg(n)),随机选择O(n)。
随机选择算法(randomized select)求解TOPK问题:
若使用快速排序 (从大到小) 时,区间划分的基准为pivot。
pivot = partition(arr, low, high);
TopK是希望求出arr[1,n]中最大的k个数,那么如果找到了第k大的数,做一次partition,就能一次性找到最大的k个数了。问题从TOK问题变成了在arr[1, n]中找到第k大的数。
- 如果pivot大于k,则说明第K大的元素在区间左边,于是只递归
arr[1, pivot-1]
区间寻找第k
大元素即可; - 如果pivot小于k,则说明说明第k大的元素在arr[pivot]的右边,于是只递归
arr[pivot+1, n]
区间,寻找第k-pivot
大的元素即可。
其代码如下:
这是一个典型的减治算法,递归内的两个分支,最终只会执行一个,随着每次递归,区间逐渐缩小,最终找到第K大的位置,它的时间复杂度是O(n)。
public static void quickSort(int[] array,int k){
quick(array,0,array.length-1,k);
}
public static void quick(int[] array,int low,int high,int k){
if(low>=high){
return;
}
int pivot = partition(array,low,high);
int num = pivot-low;
if(num>k){
quick(array,low,pivot-1,k);
}else if (num==k){
return;//只找出前K个最大的,不考虑排序问题
}else{
quick(array,pivot+1,high,k-pivot);
}
}
public static int partition(int[] array,int low, int high){
int tmp = array[low];
while(low<high){
while(low<high && array[high]<tmp){
high--;
}
if(low>=high){
break;
}else{
array[low] = array[high];
}
while(low<high && array[low]>tmp){
low++;
}
array[high] = array[low];
}
array[low] = tmp;
return low;
}
public static void main(String[] args){
int[] array = {5,4,3,2,1,7,9,10,8,0,55,99,45,24,11,17};
System.out.println(Arrays.toString(array));
quickSort(array,3);
System.out.println(Arrays.toString(array));
}
bitmap计数:空间换时间——计数排序