最近几天一直被poj上的一个题目困扰着,倒不是问题有多难,而是老是超时,而且超时不打紧,要命的是程序的主要耗时程序为排序部分,自己写的如下快速排序代码:
void swap(int *num1, int *num2)
{
int temp = *num1;
*num1 = *num2;
*num2 = temp;
}
int partition(int num[], int begin,int end)
{
while(begin<end)
{
while(begin<end && num[begin]<=num[end])
--end;
if(begin<end)
swap(&num[begin],&num[end]);
while(begin<end && num[begin]<=num[end])
++begin;
if(begin<end)
swap(&num[begin],&num[end]);
}
return begin;
}
void sort(int num[],int begin,int end)
{
if(begin<end)
{
int mid = partition(num,begin,end);
sort(num,begin,mid-1);
sort(num,mid+1,end);
}
}
用了上面属于教科书上的代码,提交,显示超时,只能对快排继续改进,由于在快速排序使用较多的函数是swap和partition,而partition使用了值传递,于是将程序改成了下面的代码:
void sort(int num[],int begin,int end)
{
int i = begin;
int j = end;
if(begin<end)
{
while(begin<end)
{
while(begin<end && num[begin]<=num[end])
--end;
if(begin<end)
{
int tmp = num[begin];
num[begin] = num[end];
num[end] =tmp;
}
while(begin<end && num[begin]<=num[end])
++begin;
if(begin<end)
{
int tmp = num[begin];
num[begin] = num[end];
num[end] =tmp;
}
}
sort(num,i,begin-1);
sort(num,begin+1,j);
}
}
再次提交,结果显示AC。显示时间为485ms。但是重复提交有时会显示超时。于是我再次使用algorithm命名空间下的sort方法,其声明如下
template <class RandomAccessIterator>
void
sort(RandomAccessIterator first, RandomAccessIterator last);
再次提交,结果显示AC,时间显示为463ms,可以看到库下面的排序要比我自己写的还是要快不少,而且是一直AC。为什么后者要比前者快呢?
网上分析的原因有:
std::sort使用的算法在大多数情况下都比quicksort算法要快,并且,在quicksort越慢的情况下越明显。Quicksort平均情况下为O(NlogN),在最坏情况下为O(N^2)。而std::sort是针对Quicksort最坏情况做的改进,从而保持了O(NlogN)的复杂度。但是,对适合quicksort的情况下,std::sort的改进没有起作用,反而多做了一些操作,就比quicksort慢了。
所以测试数据对于这两种算法的比较有很大影响。
std::sort使用的算法有些忘记了,好象是这样的:先递归使用quicksort的某个版本(主要是参照值的选择方案,用了三点选中);当长度较小时(如<20),改用另一种算法(名字忘了,它在长度较短且比较接近排序完成时比quicksort更快,这个条件正好符合此时的情形);而当性能向O(N^2)趋近时,改用heapsort。
看来自己写的快速排序确实是受测试数据的影响,在测试数据为倒序时,其时间复杂度为O(n^2)了,而std:sort的算法更加灵活,不受测试数据的影响,所以最终会比自己写的要快。