问题
在n个元素中找出第k小的元素。
解析
这是一种优秀的分治算法,下图中n个元素由小圆圈来表示,并且每一个组占一纵列。组的中位数用白色表示,而各中位数的中位数x也被标出。(当寻找偶数数目元素的中位数时,使用下中位数)。箭头从比较大的元素指向较小的元素,从中可以看出,在x的右边,每一个包含5个元素的组中都有3个元素大于x,在x的左边,每一个包含5个元素的组中有3个元素小于x。大于x的元素以阴影背景表示。
设计
1.将输入数组的n个元素划分为n/5(向下取整)组,每组5个元素。
2.寻找这n/5(向上取整)组中每一组的中位数:首先对每组元素进行插入排序,然后确定每组有序元素的中位数。
3.对第2步中找出的n/5(向上取整)个中位数,递归调用select以找出其中位数x(如果有偶数个中位数,为了方便,约定x是较小的中位数)。
4.利用修改过的PARTITION版本,按中位数的中位数x对输入数组进行划分。让k比划分的地区中的元素数目多1,因此x是第k小的元素,并且有n-k个元素在划分的高区。
5.如果i=k,则返回x。如果i<k,则在低区递归调用select来找出第i小的元素。如果i>k,则在高区递归查找第i-k小的元素。
分析
时间复杂度为O(n)
源码
#include<bits/stdc++.h>
using namespace std;
void insertsort(int a[],int low,int high){
int key,j;
for(int i=low+1; i<=high; i++) {
key = a[i];
for(j=i-1;j>=low&&key<a[j];j--) {
a[j+1] = a[j];
}
a[j+1]=key;
}
}
int partition(int a[],int p,int r,int pivot){
int x;
int i=p-1;
int j,tmp;
for (j=p;j<r;j++) {
if(a[j] == pivot) {
swap(a[j],a[r]);
}
}
x = a[r];
for(j=p;j<r;j++) {
if(a[j]<=x) {
i++;
swap(a[i],a[j]);
}
}
swap(a[i+1],a[r]);
return i+1;
}
int select(int a[], int l, int r, int k){
int group;
int left,right,mid;
int left_num;
if (r-l+1<=5) {
insertsort(a,l,r);
return a[l+k-1];
}
group=(r-l+1+5)/5;
for(int i=0;i<group;i++) {
left = l+5*i;
right = (l+5*i+4) > r?r:l+5*i+4;
mid = (left+right)/2;
insertsort(a,left,right);
swap(a[l+i],a[mid]);
}
int pivot=select(a,l,l+group-1,(group+1)/2);
int p=partition(a,l,r,pivot);
left_num=p-l;
if(k == left_num+1)
return a[p];
else if(k<=left_num)
return select(a, l, p-1, k);
else
return select(a,p+1,r,k-left_num-1);
}
int arr[10010];
int main(void){
srand(time(0));
int n,m;
cin>>n>>m;
for(int i=0;i<n;++i) arr[i]=rand()%1000;
for(int i=0;i<n;++i) cout<<arr[i]<<' ';
cout<<endl;
printf("%d\n",select(arr,0,n-1,m));
}
github : https://github.com/Geedhayb/Geed/blob/master/selectRrankK.cpp