目录
1.排序思想
归并排序(MERGE-SORT)是建立在归并操作上的一种有效的排序算法,该算法是采用分治法(Divide and Conquer)的一个非常典型的应用。将已有序的子序列合并,得到完全有序的序列;即先使每个子序列有序,再使子序列段间有序。若将两个有序表合并成一个有序表,称为二路归并。 归并排序核心步骤:分解、合并。
2.图解
3.递归版本
因为要排序,还要递归。我们肯定是要写一个子排序的,下面来说说子排序的实现逻辑。
3.1子排序代码实现
思路
先拆分:为了能够均分,我们每次拆分都取左下标 begin 和右下标 end 的数字的中值 mid 。然后分为 begin 和 mid 以及 mid + 1 和 end 两组递归,递归到最后拆分为两个一组或者一个一组然后进行排序。我们肯定是要开额外空间来存储的,然后每次将排序结果拷贝回原数组中。
合并:分到最小排序之后就要合并了,合并之后再进行排序,每次排序完要把排序结果拷贝回原数组中。因为是一个一个排序的,我们最后一定会有一组还是没有排完的状态,没有排完说明剩下的有序序列都是最大的数。我们只需要遍历剩下的元素全拷贝到开辟的数组中,最后会统一由函数拷贝回原数组。
代码:
void _MergeSort(int* a, int begin, int end, int* temp)
{
if (begin >= end)
{
return;
}
int mid = (end + begin) / 2;
//递归细分
_MergeSort(a, begin, mid, temp);
_MergeSort(a, mid+1, end, temp);
//取每次分成的两组的头和尾部的下标
int begin1 = begin, end1 = mid;
int begin2 = mid + 1, end2 = end;
int i = begin;
//两个都没走完的时候
while (begin1 <= end1 && begin2 <= end2)
{
if (a[begin1] < a[begin2])
{
temp[i++] = a[begin1++];
}
else
{
temp[i++] = a[begin2++];
}
}
//一定还有一组没排完
while (begin1 <= end1)
{
temp[i++] = a[begin1++];
}
while (begin2 <= end2)
{
temp[i++] = a[begin2++];
}
//拷贝回原数组
memcpy(a + begin, temp + begin, sizeof(int) * (end - begin + 1));
}
3.2 剩下的主体部分
没有什么技术含量,我们只需要开辟好空间然后传参调用子排序即可。
void MergeSort(int* a, int n)
{
int* temp = (int*)malloc(sizeof(int) * n);
if (temp == NULL)
{
perror("malloc fail");
return;
}
_MergeSort(a, 0, n - 1, temp);
free(temp);
temp = NULL;
}
4.非递归版本
非递归做的无非就是模拟递归版本,我们用一个gap来控制下标的间隔,第一次让gap = 1。分到最细的时候每次排序是两个数字排序或者是一个数字原地不动,那么我们可以设置一个for循环,每次 i 加上两个gap的值,就做到了跳到下一个需要的排序的区间。然后每次gap的值×2,就解决了两个区间合并的问题。
接下来就是细节问题:我们从前面可以知道我们下标是两个gap移动的,那么如果剩下的数个数不满足加的值呢?此时就会发生越界问题了。
此时会出现三种越界的情况:
1、第一组的end1越界了。
2、第二组全部越界了。
3、第二组部分越界了。
因此我们要做的就是每次都修整一下尾部的下标。
修正第一组尾部:
修正第二组全部:
修正第二组的尾部:
考虑完了越界问题,才能够高枕无忧的排序,非递归的排序和递归思路一样。这里就不过多叙述。
代码:
void MergeSortNonR(int* a, int n) { int* tmp = (int*)malloc(sizeof(int)*n); if (tmp == NULL) { perror("malloc fail"); return; } int gap = 1; while (gap < n) { // gap个数据 gap个数据归并 for (int j = 0; j < n; j += 2 * gap) { // 归并 取小的尾插 int begin1 = j, end1 = j + gap - 1; int begin2 = j + gap, end2 = j + 2 * gap - 1; // 第一组越界 if (end1 >= n) { printf("[%d,%d]", begin1, n-1); break; } // 第二组全部越界 if (begin2 >= n) { printf("[%d,%d]", begin1, end1); break; } // 第二组部分越界 if (end2 >= n) { // 修正一下end2,继续归并 end2 = n - 1; } printf("[%d,%d][%d,%d] ", begin1, end1, begin2, end2); int i = j; while (begin1 <= end1 && begin2 <= end2) { if (a[begin1] <= a[begin2]) { tmp[i++] = a[begin1++]; } else { tmp[i++] = a[begin2++]; } } while (begin1 <= end1) { tmp[i++] = a[begin1++]; } while (begin2 <= end2) { tmp[i++] = a[begin2++]; } // 拷贝回原数组 -- 归并哪部分就拷贝哪部分回去 memcpy(a+j, tmp+j, (end2-j+1)*sizeof(int)); } gap *= 2; printf("\n"); } free(tmp); tmp = NULL; }
5.特性总结
1. 归并的缺点在于需要 O(N) 的空间复杂度,归并排序的思考更多的是解决在磁盘中的外排序问题。2. 时间复杂度: O(N*logN)3. 空间复杂度: O(N)4. 稳定性:稳定