问题:给定线性序集中n个元素和一个整数k,1<=k<=n,要求找出这n个元素中第k小的元素。
我们采用快速排序的思想来解决这个问题。首先我们要找到基准的位置,如果基准的位置小于k,则表示第k小的元素在基准的后面,否则在基准的前面。
如果能在线性时间内找到一个划分基准,使得按这个基准所划分出的2个子数组的长度都至少为原数组长度的 ε 倍(0<ε<1是某个常数),那么就可以在最坏情况下用O(n)时间完成选择任务。
算法过程如下:
- 将这个函数定义为select(nums,p,r,k),即为找到nums[p:r]数组中第k(1<=k<=n)小的元素。
- 假如数组的长度小于75,那么直接用快排来解决。
- 将n个输入元素划分成ceil(n/5)个组,每组5个元素,只可能有一个组不是5个元素。用任意一种排序算法,将每组中的元素排好序,并取出每组的中位数,共ceil(n/5)个。
- 递归调用select来找出这ceil(n/5)个元素的中位数。如果ceil(n/5)是偶数,就找它的2个中位数中较大的一个。以这个元素作为划分基准。
//一次快排
int Partition(int nums[],int p,int r,int x)
{
if(p>r) return -1;
//找出基准x的位置并与第一位交换
for(int i=p;i<=r;i++)
{
if(nums[i]==x)
{
swap(x,nums[p]);
break;
}
}
int left=p,right=r;
while(left<right)
{
while(left<right && nums[right]>=x) right--;
nums[left]=nums[right];
while(left<right && nums[left]<x) left++;
nums[right]=nums[left];
}
nums[left]=x;
return left;
}
//快速排序
void QuickSort(int nums[],int low,int high)
{
if(low>high) return;
int key=nums[low];
int left=low,right=high;
while(left<right)
{
while(left<right && nums[right]>=key) right--;
nums[left]=nums[right];
while(left<right && nums[left]<key) left++;
nums[right]=nums[left];
}
nums[left]=key;
QuickSort(nums,low,left-1);
QuickSort(nums,left+1,high);
}
int Select(int nums[],int p,int r,int k)
{
if(r-p<75)
{
QuickSort(nums,p,r);
return nums[p+k-1];
}
//每5个为一组,找到各组的中位数,并存储在前(r-p-4)/5个位置里
for(int i=0;i<=(r-p-4)/5;i++)
{
QuickSort(nums,p+5*i,p+5*i+4);
swap(nums[p+i],nums[p+5*i+2]);
}
//找所有中位数的中位数
int x=Select(nums,p,p+(r-p-4)/5,(r-p-4)/10);
//以x为基准做一次快排
int i=Partition(nums,p,r,x);
int j=i-p+1;
//判断k属于那个部分
if(k<=j)
return Select(nums,p,i,k);
else
return Select(nums,i+1,r,k-j);
}
为什么是线性时间呢?
设所有元素互不相同。在这种情况下,找出的基准x至少比3(n-5)/10个元素大,因为在每一组中有2个元素小于本组的中位数,有floor(n/5-1)/2*2=floor(n/5-1)个元素小于基准,而ceil(n/5)个中位数中又有floor((n-5)/10)(=(n/5-1)/2)个小于基准x。同理,基准x也至少比3(n-5)/10(=(n/5)-1+(n-5)/10)个元素小。而当n≥75时,3(n-5)/10≥n/4所以按此基准划分所得的2个子数组的长度都至少缩短1/4。故原问题的时间复杂度可表示为:
T(n)=c ,n<75
T(n)=T(n/5)+T(3n/4)+cn ,n>=75
上述算法将每一组的大小定为5,并选取75作为是否作递归调用的分界点。这2点保证了T(n)的递归式中2个自变量之和n/5+3n/4=19n/20=εn,0<ε<1。这是使T(n)=O(n)的关键之处。当然,除了5和75之外,还有其他选择。读者也可以考虑7的情况。