目录
1.概念
归并排序(MERGE-SORT)是建立在归并操作上的一种有效的排序算法,该算法是采用分治法(Divide and Conquer)的一个非常典型的应用。将已有序的子序列合并,得到完全有序的序列;即先使每个子序列有序,再使子序列段间有序。若将两个有序表合并成一个有序表,称为二路归并。 归并排序核心步骤:
2.归并排序递归版本的实现
// 归并排序递归实现
void _MergeSort(int* a, int* tmp, int begin, int end)
{
if (begin == end) //如果区间只有一个值,直接返回
{
return;
}
int mid = (begin + end) / 2;
//[begin, mid - 1],[mid, end]这种分割方式会进入死循环,因为除法本事就会丢数据,当为[偶数,
//偶数+1]区间时,分出来的右区间还是[偶数,偶数+1]
//[begin, mid], [mid+1, end]
//如果[begin, mid], [mid + 1, end]有序,就可以进行归并了
//使左右区间有序,进行子问题递归
_MergeSort(a, tmp, begin, mid);
_MergeSort(a, tmp, mid + 1, end);
//归并
int begin1 = begin, end1 = mid;
int begin2 = mid + 1, end2 = end;
int i = begin;
while (begin1 <= end1 && begin2 <= end2)
{
if (a[begin1] < a[begin2])
{
tmp[i++] = a[begin1++];
}
else
{
tmp[i++] = a[begin2++];
}
}
while (begin1 <= end1)
{
tmp[i++] = a[begin1++];
}
while (begin2 <= end2)
{
tmp[i++] = a[begin2++];
}
//拷贝时一段一段拷贝,拷贝每一段的[begin, end]区间
memcpy(a+begin, tmp+begin, (end - begin + 1) * sizeof(int));
}
void MergeSort(int* a, int n)
{
//左区间和右区间有序,借助一个新的数组,取小的尾插
int* tmp = (int*)malloc(sizeof(int) * n);
if (tmp == NULL)
{
perror("malloc fail!\n");
exit(1);
}
_MergeSort(a, tmp, 0, n - 1);
free(tmp);
tmp = NULL;
}
3.归并排序非递归版本的实现
归并排序的非递归实现,就数组从头开始先一一归并,然后再二二归并,然后再四四归并,依次类推。归并排序非递归版本中出现的问题我已经写在了代码中的注释中,也可以将注释的printf语句取消注释,观察每次非递归模拟递归的区间。
// 归并排序非递归实现
void MergeSortNonR(int* a, int n)
{
int* tmp = (int*)malloc(sizeof(int) * n);
if (tmp == NULL)
{
perror("malloc fail!\n");
exit(1);
}
//gap是每组归并数据子区间的数据个数
//11归并,gap == 1
//则每组归并数据子区间的数据个数为1
int gap = 1;
while (gap < n)
{
//printf("gap = %d->:", gap);
for (int i = 0; i < n; i += 2 * gap) //11归并,则到下一组归并时要跳2个gap
{
//[begin1, end1],[begin2, end2]
int begin1 = i, end1 = begin1 + gap - 1; //闭区间的结束位置为[左 + gap - 1]
int begin2 = end1 + 1, end2 = begin2 + gap - 1;
//printf("[%d, %d],[%d, %d];", begin1, end1, begin2, end2);
//存在的越界情况,以10个数据为例
//打印结果:
//gap = 1->:[0, 0],[1, 1];[2, 2],[3, 3];[4, 4],[5, 5];[6, 6],[7, 7];[8, 8],[9,
//9];
//gap = 2->: [0, 1] , [2, 3];[4, 5], [6, 7];[8, 9], [10, 11];
//gap = 4-> : [0, 3] , [4, 7];[8, 11], [12, 15];
//gap = 8-> : [0, 7] , [8, 15];
//情况1:gap == 8的区间[8, 15],只有end2越界
//情况2:gap == 2的区间[10, 11],begin2和end2越界
//情况3:gap == 4的区间[8, 11],[12, 15] end1,begin2和end2越界
//上述的情况2和情况3可以合为1种情况(则[begin2,end2]区间不存在),该情况下不需要归并
//这个判断语句处理的是情况2和情况3,当begin2越界的时候,不用处理,当end1越界的时
//候,begin2也越界了,也不用处理
if (begin2 >= n)
{
break;
}
if (end2 >= n)
{
end2 = n - 1;
}
//printf("[%d, %d],[%d, %d];", begin1, end1, begin2, end2);
int j = begin1;
while (begin1 <= end1 && begin2 <= end2)
{
if (a[begin1] < a[begin2])
{
tmp[j++] = a[begin1++];
}
else
{
tmp[j++] = a[begin2++];
}
}
while (begin1 <= end1)
{
tmp[j++] = a[begin1++];
}
while (begin2 <= end2)
{
tmp[j++] = a[begin2++];
}
//写end2 - i + 1,是因为在归并的过程中begin1在改变
memcpy(a + i, tmp + i, (end2 - i + 1) * sizeof(int));
}
//printf("\n");
gap *= 2;
}
free(tmp);
tmp = NULL;
}
4.归并排序的特性总结
(1)
归并的缺点在于需要
O(N)
的空间复杂度,归并排序的思考更多的是解决在磁盘中的外排序问题。
(2)
时间复杂度:
O(N*logN)
(3)
空间复杂度:
O(N)
(4)
稳定性:稳定