归并排序(Merge Sort)是一种基于分治策略的经典排序算法。
基本思想
归并排序的基本思想是将一个大数组分为两个较小的子数组,分别对这两个子数组进行排序,然后将两个有序的子数组合并成一个完整的有序数组。这个过程通过递归方式不断进行,直至每个子数组仅包含一个元素,这时整个数组自然就变得有序了。
算法步骤
- 分割:将待排序的数组分割成两半,直到每个子数组只有一个元素。
- 递归排序:对分割后的子数组进行递归排序。
- 合并:将两个有序的子数组合并成一个有序数组。
具体来说,算法步骤如下:
- 选择一个中间点,将数组分成左右两部分。
- 分别对左右两部分递归执行归并排序。
- 合并两个有序部分,形成最终的有序数组。
示例代码
void _MergeSort(int* a, int* tmp, int begin, int end)
{
if (begin == end) // 如果起始和结束相同,表示只有一个元素,无需排序
return;
int mid = (begin + end) / 2; // 计算中间下标
//[begin,mid][mid+1,end];
// 分别对左右两个子数组进行归并排序
_MergeSort(a, tmp, begin, mid);
_MergeSort(a, tmp, mid + 1, end);
int begin1 = begin, end1 = mid; // 左子数组的起始下标和结束下标
int begin2 = mid+1, end2 = end; // 右子数组的起始下标和结束下标
int i = begin; // 临时数组的下标
// 将左右两个子数组中的元素按顺序合并到临时数组中
while (begin1 <= end1 && begin2 <= end2)
{
if (a[begin1] < a[begin2])
{
tmp[i++] = a[begin1++];
}
else
{
tmp[i++] = a[begin2++];
}
}
// 将左子数组中剩余的元素复制到临时数组中
while (begin1 <= end1)
{
tmp[i++] = a[begin1++];
}
// 将右子数组中剩余的元素复制到临时数组中
while (begin2 <= end2)
{
tmp[i++] = a[begin2++];
}
// 将临时数组中的元素复制回原始数组
memcpy(a + begin, tmp + begin, (end - begin + 1) * sizeof(int));
}
void MergeSort(int* a, int n)
{
int* tmp = (int*)malloc(sizeof(int) * n); // 临时数组,用于存储归并排序过程中的中间结果
if (tmp == NULL)
{
perror("malloc");
return;
}
// 调用辅助函数进行归并排序
_MergeSort(a, tmp, 0, n - 1);
free(tmp); // 释放临时数组的内存
tmp = NULL;
}
非递归代码
void MergeSort(int* a, int n)
{
int* tmp = (int*)malloc(sizeof(int) * n);
if (tmp == NULL)
{
perror("malloc");
return;
}
//gap每组归并的个数
int gap = 1;
while (gap < n)
{
for (int i = 0; i < n; i += gap * 2)
{
//[began1,end1][began2,end2]
int begin1 =i, end1 = i+gap-1;
int begin2 =i+gap, end2 = i+2*gap-1;
//第二组都越界不存在,不用归并
if (begin2 >= n)
{
break;
}
//第二组began2没越界,end2越界了,需要重新修正end2
if (end2 >= n)
{
end2 = n - 1;
}
int j = i;
while (begin1 <= end1 && begin2 <= end2)
{
if (a[begin1] < a[begin2])
{
tmp[j++] = a[begin1++];
}
else
{
tmp[j++] = a[begin2++];
}
}
while (begin1 <= end1)
{
tmp[j++] = a[begin1++];
}
while (begin2 <= end2)
{
tmp[j++] = a[begin2++];
}
memcpy(a + i, tmp + i, (end2-i+1) * sizeof(int));
}
gap *= 2;
}
free(tmp);
tmp = NULL;
}
时间复杂度
归并排序的平均和最坏情况下的时间复杂度都是O(n log n)。这是因为归并排序将数组分割成log n个部分,每次合并需要O(n)时间。
空间复杂度
归并排序的空间复杂度是O(n),因为在合并过程中需要一个与原数组大小相同的临时数组来存储中间结果。
优点
- 效率高:归并排序的时间复杂度为O(n log n),对于大规模数据排序非常高效。
- 稳定性:归并排序是一种稳定的排序算法,相同元素的相对顺序在排序过程中不会改变。
- 适用性广泛:归并排序适用于各种数据类型和规模。
缺点
- 空间开销大:由于需要额外的空间存储临时数组,因此空间复杂度为O(n),这在内存受限的环境中可能成为问题。
- 递归开销:归并排序使用递归实现,递归调用可能会增加额外的开销,特别是在数据量较大时。
稳定性
归并排序是稳定的排序算法。这意味着在排序过程中,具有相同值的元素的相对顺序不会改变。例如,如果有两个相同的元素A和B,且A在B之前,那么在排序后的数组中,A仍然会在B之前。