一.核心思想
先分治后合并,将已经有序的子序列合并,得到完全有序的序列。即先使每个子序列有序,再使子序列段间有序。若将两个有序表合并成一个有序表,称为二路归并。
二.代码实现
归并排序的递归方式更像是二叉树的后序遍历
每次单趟排序就是从两个已经有序的区间进行归并,归并到一个临时数组后再拷贝回去
(当递归到每个区间只有一个值的时候,此区间一定是有序的)
1.递归
递归
void _MergeSort(int* arr, int begin, int end, int* tmp)
{
//递归出口条件
if (begin >= end)
{
return;
}
int mid = begin + (end - begin) / 2;
//递归[begin,mid]
_MergeSort(arr, begin, mid, tmp);
//递归[mid+1,end]
_MergeSort(arr, mid + 1, end, tmp);
int begin1 = begin, end1 = mid;
int begin2 = mid + 1, end2 = end;
int index = begin1;
//归并到临时数组tmp
while (begin1 <= end1 && begin2 <= end2)
{
if (arr[begin1] < arr[begin2])
{
tmp[index++] = arr[begin1++];
}
else
{
tmp[index++] = arr[begin2++];
}
}
while (begin1 <= end1)
{
tmp[index++] = arr[begin1++];
}
while (begin2 <= end2)
{
tmp[index++] = arr[begin2++];
}
//拷贝回原数组
memcpy(arr + begin, tmp + begin, sizeof(int) * (end - begin + 1));
}
2.非递归
栈和队列这样的数据结构只能适用模拟前序遍历,而归并排序属于后续遍历,采用数组来模拟实现
使用数组模拟,用一个循环
但需要注意数组越界的问题:
假设一行中最后要归并的两个区间为:[begin1, end1] [begin2, end2]
有两种解决方法:
1.一行全部排完后,将一组数据一次性的整体拷贝回原数组,end1或者begin1或者end2越界都要修正。
(1)end1越界,修正end1为end,将begin2和end2修正为一个不存在的区间
(2)begin2越界,将begin2和end2修正为一个不存在的区间
(3)end2越界,修正end2为end
注意:因为这里是归并好一行后,将整体拷贝回去,所以如果begin2和end2发生越界,选择了直接跳出循环不进行归并,那么就会发生把tmp中的随机值拷贝回去了!!
2.归并好两个区间后,就将这两个归并好的区间拷贝回去,并不是等待一行全部归并好再整体拷贝回去,
这就意味着只需要拷贝回归并好的区间,不需要归并的区间就不用继续进行操作了
(1)这样可以考虑一旦end1或begin2发生越界直接跳出循环,本躺不用再继续归并了,因为此时只有begin1,end1一个区间
(2)end2发生越界,修正end2为end
以下代码展示解决方法一:
void _MergeSort(int* arr, int begin, int end, int* tmp)
{
int gap = 1;
while (gap < end)
{
for (int i = 0; i <= end; i += 2 * gap)
{
int begin1 = i, end1 = i + gap - 1;
int begin2 = i + gap, end2 = i + 2 * gap - 1;
//判断越界情况
if (end1 > end)
{
end1 = end;
begin2 = end + 2;
end2 = end + 1;
}
else if (begin2 > end)
{
begin2 = end + 2;
end2 = end + 1;
}
else if (end2 > end)
{
end2 = end;
}
int index = begin1;
//归并
while (begin1 <= end1 && begin2 <= end2)
{
if (arr[begin1] < arr[begin2])
{
tmp[index++] = arr[begin1++];
}
else
{
tmp[index++] = arr[begin2++];
}
}
while (begin1 <= end1)
{
tmp[index++] = arr[begin1++];
}
while (begin2 <= end2)
{
tmp[index++] = arr[begin2++];
}
}
gap *= 2;
//整体拷贝回去
memcpy(arr, tmp, sizeof(int) * (end + 1));
}
}