1. 归并排序
- 基本思想:
归并排序(MERGE-SORT)是建立在归并操作上的一种有效的排序算法,该算法是采用分治法(Divide and Conquer)的一个非常典型的应用。将已有序的子序列合并,得到完全有序的序列;即先使每个子序列有序,再使子序列段间有序。若将两个有序表合并成一个有序表,称为二路归并。 归并排序核心步骤:
- 注意❗:要及时的从
tmp
拷贝回a
原来数组;
🍎要考虑tmp
数组的起始位置:
🍎为了避免重复的开辟 tmp
数据,所以采取调用子函数的形式。
void _MergeSort(int* a, int begin, int end, int* tmp)
{
if (begin >= end)
return;
int mid = (begin + end) / 2;
// [begin, mid][mid+1, end]
_MergeSort(a, begin, mid, tmp);
_MergeSort(a, mid+1, end, tmp);
// [begin, mid][mid+1, end]归并
int begin1 = begin, end1 = mid;
int begin2 = mid + 1, end2 = end;
int i = begin;
while (begin1 <= end1 && begin2 <= end2)
{
if (a[begin1] < a[begin2])
{
tmp[i++] = a[begin1++];
}
else
{
tmp[i++] = a[begin2++];
}
}
while(begin1 <= end1)
{
tmp[i++] = a[begin1++];
}
while (begin2 <= end2)
{
tmp[i++] = a[begin2++];
}
memcpy(a + begin, tmp + begin, sizeof(int) * (end - begin + 1));
}
void MergeSort(int* a, int n)
{
int* tmp = (int*)malloc(sizeof(int) * n);
if (tmp == NULL)
{
perror("malloc fail");
return;
}
_MergeSort(a, 0, n - 1, tmp);
free(tmp);
}
2. 归并排序(非递归版本)
🐧 快排的本质是 前序; 归并的本质是 后序
🐧 快排递归回来的时候不需要获取区间了,不需要处理递归回来的区间了;但是归并需要获取,因为归并是先 归,之后还需要 并。
- 🍎
gap
表示归并每组中数据的个数,归并的递归写法是先划分区间,那我们非递归写法可以直接反过来思考从gap = 1
的时候开始处理。
- 🍎 要注意处理边界的情况,可能归并的区间已经越界。❗
// 归并排序 ~ 非递归版本
void MergeSortNonR(int* a, int n)
{
int* tmp = (int*)malloc(sizeof(int) * n);
if (tmp == NULL)
{
perror("malloc fail");
return;
}
int gap = 1;
while (gap < n)
{
for (size_t i = 0; i < n; i += 2 * gap)
{
int begin1 = i, end1 = i + gap - 1;
int begin2 = i + gap, end2 = i + 2 * gap - 1;
// [begin1, end1][begin2, end2] 归并
// 边界的处理
if (end1 >= n || begin2 >= n)
{
break;
}
if (end2 >= n)
{
end2 = n - 1;
}
int j = begin1;
while (begin1 <= end1 && begin2 <= end2)
{
if (a[begin1] < a[begin2])
{
tmp[j++] = a[begin1++];
}
else
{
tmp[j++] = a[begin2++];
}
}
while (begin1 <= end1)
{
tmp[j++] = a[begin1++];
}
while (begin2 <= end2)
{
tmp[j++] = a[begin2++];
}
memcpy(a + i, tmp + i, sizeof(int) * (end2-i+1));
}
printf("\n");
gap *= 2;
}
free(tmp);
}
3.归并排序的应用
🐧 ① 归并的缺点在于需要O(N)的空间复杂度,归并排序更多的是解决在磁盘中的外排序问题。
🐧 ② 时间复杂度:O(N*logN)
🐧 ③ 空间复杂度:O(N)
🐧 ④ 稳定性:稳定
- 如果我们需要对 40G 的文件进行排序的时候,我们该怎么处理呢?
🍎 我们没有 40G的内存,所以把文件不断分割成为小的文件,然后再对小文件进行归并排序。