归并排序是利用递归和分而治之的技术将数据序列划分成为越来越小的半子表,再对半子表排序,最后再用递归步骤将排好序的半子表合并成为越来越大的有序序列,归并排序包括两个步骤,分别为:

     1)划分子表

     2)合并半子表

    首先我们来讨论归并算法,归并算法将一系列数据放到一个向量中,索引范围为[first,last],这个序列由两个排好序的子表构成,以索引终点(mid)为分界线,以下面一个序列为例

   7,10,19,25,12,17,21,30,48

  这样的一个序列中,分为两个子序列 7,10,19,25  和 12,17,21,30,48,如下图所示:

p_w_picpath

再使用归并算法的时候的步骤如下:

第一步:比较v[indexA]=7和v[indexB]=12,将较小的v[indexA]取出来放到临时向量tempArray中,然后indexA加1

p_w_picpath


第二步:比较v[indexA]=10和v[indexB]=12,将较小的10放到临时变量tempArray中,然后indexA++;

p_w_picpath

第三步:比较v[indexA]=19与v[indexB]=12,将较小的12存放到临时变量tempArray中,然后indexB++;

p_w_picpath

第四步到第七步:按照以上规则,进行比对和存储,得到如下结果:

p_w_picpath

最后一步:将子表b中剩余项添加到临时向量tempArray中

p_w_picpath

然后将临时变量中的值按照索引位置,拷贝回向量v中,就完成了对向量v的归并排序

算法函数为:

public void Merger(int[] v, int first, int mid, int last)
      {
          Queue<int> tempV = new Queue<int>();
          int indexA, indexB;
          //设置indexA,并扫描subArray1 [first,mid]
          //设置indexB,并扫描subArray2 [mid,last]
          indexA = first;
          indexB = mid;
          //在没有比较完两个子标的情况下,比较 v[indexA]和v[indexB]
          //将其中小的放到临时变量tempV中
          while (indexA < mid && indexB < last)
          {
              if (v[indexA] < v[indexB])
              {
                  tempV.Enqueue(v[indexA]);
                  indexA++;
              }
              else
              {
                  tempV.Enqueue(v[indexB]);
                  indexB++;
              }
          }
          //复制没有比较完子表中的元素
          while (indexA < mid)
          {
              tempV.Enqueue(v[indexA]);
              indexA++;
          }
          while (indexB < last)
          {
              tempV.Enqueue(v[indexB]);
              indexB++;
          }
          int index = 0;
          while (tempV.Count > 0)
          {
              v[first+index] = tempV.Dequeue();
              index++;
          }
      }


  实现归并排序;归并排序算法分为两步,第一步:先将原来的数据表分成排好序的子表,然后调用 Merger  对子表进行归并,使之成为有序表,例如有如下向量:

 25,10,7,19,3,48,12,17,56,30,21

对此序列进行归并排序的步骤为:

p_w_picpath

归并算法函数为

public void MergerSort(int[] v, int first, int last)
      {
          if (first + 1 < last)
          {
              int mid = (first + last) / 2;
              MergerSort(v, first, mid);
              MergerSort(v, mid, last);
              Merger(v, first, mid, last);
          }
      }


归并算法的划分子表和归并子表与原数据序列次序无关,因此算法的最坏情况,最坏情况和平均情况时间复杂度是一样的

下面是归并算法的函数调用图

p_w_picpath



归并排序是建立在归并操作上的一种有效的排序算法。该算法是采用分治法(Divide and Conquer)的一个非常典型的应用。

首先考虑下如何将将二个有序数列合并。这个非常简单,只要从比较二个数列的第一个数,谁小就先取谁,取了后就在对应数列中删除这个数。然后再进行比较,如果有数列为空,那直接将另一个数列的数据依次取出即可。

  1. //将有序数组a[]和b[]合并到c[]中

  2. void MemeryArray(int a[], int n, int b[], int m, int c[])  

  3. {  

  4. int i, j, k;  

  5.    i = j = k = 0;  

  6. while (i < n && j < m)  

  7.    {  

  8. if (a[i] < b[j])  

  9.            c[k++] = a[i++];  

  10. else

  11.            c[k++] = b[j++];  

  12.    }  

  13. while (i < n)  

  14.        c[k++] = a[i++];  

  15. while (j < m)  

  16.        c[k++] = b[j++];  

  17. }  

可以看出合并有序数列的效率是比较高的,可以达到O(n)。

解决了上面的合并有序数列问题,再来看归并排序,其的基本思路就是将数组分成二组A,B,如果这二组组内的数据都是有序的,那么就可以很方便的将这二组数据进行排序。如何让这二组组内数据有序了?

可以将A,B组各自再分成二组。依次类推,当分出来的小组只有一个数据时,可以认为这个小组组内已经达到了有序,然后再合并相邻的二个小组就可以了。这样通过先递的分解数列,再合数列就完成了归并排序。

  1. //将有二个有序数列a[first...mid]和a[mid...last]合并。

  2. void mergearray(int a[], int first, int mid, int last, int temp[])  

  3. {  

  4. int i = first, j = mid + 1;  

  5. int m = mid,   n = last;  

  6. int k = 0;  

  7. while (i <= m && j <= n)  

  8.    {  

  9. if (a[i] <= a[j])  

  10.            temp[k++] = a[i++];  

  11. else

  12.            temp[k++] = a[j++];  

  13.    }  

  14. while (i <= m)  

  15.        temp[k++] = a[i++];  

  16. while (j <= n)  

  17.        temp[k++] = a[j++];  

  18. for (i = 0; i < k; i++)  

  19.        a[first + i] = temp[i];  

  20. }  

  21. void mergesort(int a[], int first, int last, int temp[])  

  22. {  

  23. if (first < last)  

  24.    {  

  25. int mid = (first + last) / 2;  

  26.        mergesort(a, first, mid, temp);    //左边有序

  27.        mergesort(a, mid + 1, last, temp); //右边有序

  28.        mergearray(a, first, mid, last, temp); //再将二个有序数列合并

  29.    }  

  30. }  

  31. bool MergeSort(int a[], int n)  

  32. {  

  33. int *p = newint[n];  

  34. if (p == NULL)  

  35. returnfalse;  

  36.    mergesort(a, 0, n - 1, p);  

  37. delete[] p;  

  38. returntrue;  

  39. }  

归并排序的效率是比较高的,设数列长为N,将数列分开成小数列一共要logN步,每步都是一个合并有序数列的过程,时间复杂度可以记为O(N),故一共为O(N*logN)。因为归并排序每次都是在相邻的数据中进行操作,所以归并排序在O(N*logN)的几种排序方法(快速排序,归并排序,希尔排序,堆排序)也是效率比较高的。

在本人电脑上对冒泡排序,直接插入排序,归并排序及直接使用系统的qsort()进行比较(均在Release版本下)

对20000个随机数据进行测试:

1339667485_3225.jpg

对50000个随机数据进行测试:

1339667579_6014.jpg

再对200000个随机数据进行测试:

1339667519_5952.jpg


注:有的书上是在mergearray()合并有序数列时分配临时数组,但是过多的new操作会非常费时。因此作了下小小的变化。只在MergeSort()中new一个临时数组。后面的操作都共用这一个临时数组。