出自:http://algorithm.chaoskey.com/02/07
【题目 】:给定线性序集中n个元素和一个整数k,1≤k≤n,要求找出这n个元素中第k小的元素,(这里给定的线性集是无序 的)
【思路 】:如果能在线性时间内找到一个划分基准 ,使得按这个基准所划分出的2个子数组的长度都至少为原数组长度的ε倍(0<ε<1是某个正常数),那么就可以在最坏情况下用O(n)时间完成选择任务。 例如 :若ε=9/10,算法递归调用所产生的子数组的长度至少缩短1/10。所以,在最坏情况下,算法所需的计算时间T(n)满足递归式T(n)≤T(9n/10)+O(n) 。由此可得T(n)=O(n)。
【具体解题 】:这里我们将所有的数(n个),以每5个划分为一组,共[n/5]组(将不足五个的那组忽略);然后用任意一种排序算法 (因为只对五个数进行排序,所以任取一种排序法就可以了,这里我选用冒泡排序),将每组中的元素排好序再分别取每组的中位数,得到[n/5]个中位数;再 取这[n/5]个中位数的中位数(如果n/5是偶数,就找它的2个中位数中较大的一个)作为划分基准,将全部的数划分为两个部分,小于基准的在左边,大于 等于基准的放右边。 在这种情况下,找出的基准x至少比3(n-5)/10个元素大,因为在每一组中有2个元素小于本组的中位数,中位数处于1/2*[n/5-1],即n/5 个中位数中又有(n-5)/10个小于基准x。同理,基准x也至少比3(n-5)/10个元素小。而当n≥75时,3(n-5)/10≥n/4所以按此基 准划分所得的2个子数组的长度都至少缩短1/4。 程序代码如下:
#include<iostream.h>
#include<stdlib.h>
#include<time.h>
#define MAX_VALUE 10000
#define random() rand()%MAX_VALUE
#define N 10000
int a[N];
class Find
{
public:
void bubble(int first,int end) // 冒泡排序
{
for(int flag=first;flag<end;flag++)
for(int i=end;i>flag;i--)
if(a[i]<a[i-1])
{ int t=a[i];
a[i]=a[i-1];
a[i-1]=t;
}
}
int partition(int p,int r,int x) // 数组 a 中从 a[p] 到 a[r] 的元素按照 x 划分 , 大于 x 的在左边 , 小于 x 的在右边
{
int i,j;
for(i=p,j=r;i<j;i++)
{
if(a[i]>x)
{
while(i<j&&a[j]>x)
j--;
if(i!=j){
int t=a[i];
a[i]=a[j];
a[j]=t;
j--;
}
}
}
return i-1;
}
int select(int p,int r,int k) // 寻找中位数
{
if(r-p<5){
bubble(p,r);
return a[p+k-1];
}
for(int i=0;i<(r-p-4)/5;i++)
{
int s=p+5*i,t=s+4;
bubble(s,t);
int temp=a[p+i];
a[p+i]=a[s+2];
a[s+2]=temp;
}
int x=select(p,p+(r-p-4)/5,(r-p+6)/10);
i=partition(p,r,x);
int j=i-p+1;
if(k<=j)
return select(p,i,k);
else
return select(i+1,r,k-j);
}
};
void main()
{
clock_t start,end;
double elapsed;
srand((int)time(NULL));
for(int k=0;k<N;k++)
{
a[k]=random();
cout<<a[k]<<"/t";
}
cout<<endl;
start=clock();
Find f;
int n=5000;
cout<<"The No."<<n<<" is :"<<f.select(0,N-1,n)<<endl;
end=clock();
elapsed=((double)(end-start));///CLOCKS_PER_SEC;
cout<<"Time: "<<elapsed<<endl;
}
这个题目关键在寻找划分基准,从而提高寻找效率,时间复杂度为o(n);
|