线性时间选择

问题:给定线性序集中n个元素和一个整数k,1<=k<=n,要求找出这n个元素中第k小的元素。

我们采用快速排序的思想来解决这个问题。首先我们要找到基准的位置,如果基准的位置小于k,则表示第k小的元素在基准的后面,否则在基准的前面。

如果能在线性时间内找到一个划分基准,使得按这个基准所划分出的2个子数组的长度都至少为原数组长度的 ε 倍(0<ε<1是某个常数),那么就可以在最坏情况下用O(n)时间完成选择任务。

算法过程如下:

  • 将这个函数定义为select(nums,p,r,k),即为找到nums[p:r]数组中第k(1<=k<=n)小的元素。
  • 假如数组的长度小于75,那么直接用快排来解决。
  • 将n个输入元素划分成ceil(n/5)个组,每组5个元素,只可能有一个组不是5个元素。用任意一种排序算法,将每组中的元素排好序,并取出每组的中位数,共ceil(n/5)个。
  • 递归调用select来找出这ceil(n/5)个元素的中位数。如果ceil(n/5)是偶数,就找它的2个中位数中较大的一个。以这个元素作为划分基准。

在这里插入图片描述

//一次快排
int Partition(int nums[],int p,int r,int x)
{
	if(p>r) return -1;
	//找出基准x的位置并与第一位交换 
	for(int i=p;i<=r;i++)
	{
		if(nums[i]==x)
		{
			swap(x,nums[p]);
			break;
		}
	}
	int left=p,right=r;
	while(left<right)
	{
		while(left<right && nums[right]>=x) right--;
		nums[left]=nums[right];
		while(left<right && nums[left]<x) left++;
		nums[right]=nums[left];
	}
	nums[left]=x;
	return left;
}

//快速排序
void QuickSort(int nums[],int low,int high)
{
	if(low>high) return;
	int key=nums[low];
	int left=low,right=high;
	while(left<right)
	{
		while(left<right && nums[right]>=key) right--;
		nums[left]=nums[right];
		while(left<right && nums[left]<key) left++;
		nums[right]=nums[left];
	}
	nums[left]=key;
	QuickSort(nums,low,left-1);
	QuickSort(nums,left+1,high);
}

int Select(int nums[],int p,int r,int k)
{
	if(r-p<75)
	{
		QuickSort(nums,p,r);
		return nums[p+k-1]; 
	}
	//每5个为一组,找到各组的中位数,并存储在前(r-p-4)/5个位置里	
	for(int i=0;i<=(r-p-4)/5;i++)
	{
		QuickSort(nums,p+5*i,p+5*i+4);
		swap(nums[p+i],nums[p+5*i+2]);
	}
	//找所有中位数的中位数 
	int x=Select(nums,p,p+(r-p-4)/5,(r-p-4)/10);
	//以x为基准做一次快排 
	int i=Partition(nums,p,r,x);
	int j=i-p+1;
	//判断k属于那个部分 
	if(k<=j)
		return Select(nums,p,i,k);
	else
	    return Select(nums,i+1,r,k-j);
}  

为什么是线性时间呢?
设所有元素互不相同。在这种情况下,找出的基准x至少比3(n-5)/10个元素大,因为在每一组中有2个元素小于本组的中位数,有floor(n/5-1)/2*2=floor(n/5-1)个元素小于基准,而ceil(n/5)个中位数中又有floor((n-5)/10)(=(n/5-1)/2)个小于基准x。同理,基准x也至少比3(n-5)/10(=(n/5)-1+(n-5)/10)个元素小。而当n≥75时,3(n-5)/10≥n/4所以按此基准划分所得的2个子数组的长度都至少缩短1/4。故原问题的时间复杂度可表示为:

T(n)=c                  ,n<75
T(n)=T(n/5)+T(3n/4)+cn  ,n>=75

上述算法将每一组的大小定为5,并选取75作为是否作递归调用的分界点。这2点保证了T(n)的递归式中2个自变量之和n/5+3n/4=19n/20=εn,0<ε<1。这是使T(n)=O(n)的关键之处。当然,除了5和75之外,还有其他选择。读者也可以考虑7的情况。

  • 5
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值