为什么自己写的快速排序要比algorithm命名空间下的sort要慢？

最新推荐文章于 2021-08-20 17:24:36 发布

最新推荐文章于 2021-08-20 17:24:36 发布 · 452 阅读

最近几天一直被poj上的一个题目困扰着，倒不是问题有多难，而是老是超时，而且超时不打紧，要命的是程序的主要耗时程序为排序部分，自己写的如下快速排序代码：

void swap(int *num1, int *num2)
 {
     int temp = *num1;
     *num1 = *num2;
     *num2 = temp;
 }
 int partition(int num[], int begin,int end)
 {
    while(begin<end)
    {
       while(begin<end && num[begin]<=num[end]) 
	  --end;
       if(begin<end) 
          swap(&num[begin],&num[end]);
       while(begin<end && num[begin]<=num[end])
	 ++begin;
       if(begin<end) 
         swap(&num[begin],&num[end]);
    }
    return begin;
 }
 void sort(int num[],int begin,int end)
 {
    if(begin<end)
    {
       int mid = partition(num,begin,end);
       sort(num,begin,mid-1);
       sort(num,mid+1,end);
    }
}

用了上面属于教科书上的代码，提交，显示超时，只能对快排继续改进，由于在快速排序使用较多的函数是swap和partition，而partition使用了值传递，于是将程序改成了下面的代码：

void sort(int num[],int begin,int end)
{
    int i = begin;
    int j = end;
    if(begin<end)
    {
         while(begin<end)
         {
              while(begin<end && num[begin]<=num[end])
                       --end;
              if(begin<end)
              {
                  int tmp = num[begin];   
                  num[begin] = num[end];
                  num[end] =tmp;
              } 
              while(begin<end && num[begin]<=num[end]) 
                       ++begin;
              if(begin<end) 
              {
                  int tmp = num[begin];   
                  num[begin] = num[end];
                  num[end] =tmp;
              } 
         }
         sort(num,i,begin-1);
         sort(num,begin+1,j);
    }
}

再次提交，结果显示AC。显示时间为485ms。但是重复提交有时会显示超时。于是我再次使用algorithm命名空间下的sort方法，其声明如下

template <class RandomAccessIterator>
    void
    sort(RandomAccessIterator first, RandomAccessIterator last);

再次提交，结果显示AC，时间显示为463ms，可以看到库下面的排序要比我自己写的还是要快不少，而且是一直AC。为什么后者要比前者快呢？

网上分析的原因有：

std::sort使用的算法在大多数情况下都比quicksort算法要快，并且，在quicksort越慢的情况下越明显。Quicksort平均情况下为O(NlogN)，在最坏情况下为O(N^2)。而std::sort是针对Quicksort最坏情况做的改进，从而保持了O(NlogN)的复杂度。但是，对适合quicksort的情况下，std::sort的改进没有起作用，反而多做了一些操作，就比quicksort慢了。
所以测试数据对于这两种算法的比较有很大影响。

std::sort使用的算法有些忘记了，好象是这样的：先递归使用quicksort的某个版本（主要是参照值的选择方案，用了三点选中）；当长度较小时（如<20），改用另一种算法（名字忘了，它在长度较短且比较接近排序完成时比quicksort更快，这个条件正好符合此时的情形）；而当性能向O(N^2)趋近时，改用heapsort。

看来自己写的快速排序确实是受测试数据的影响，在测试数据为倒序时，其时间复杂度为O(n^2)了，而std:sort的算法更加灵活，不受测试数据的影响，所以最终会比自己写的要快。