数据结构—其他的排序(排序1)
链接: link.
数据结构—快速排序(排序2)
链接: link.
以上的排序方法适用于内存排序。
但是对于归并排序来说更适用于外存(磁盘)排序,当然也可以用作内存排序
1. 基本思想及实现过程
归并排序(MERGE-SORT)是建立在归并操作上的一种有效的排序算法,该算法是采用分治法(Divide and Conquer)的一个非常典型的应用。将已有序的子序列合并,得到完全有序的序列;即先使每个子序列有 序,再使子序列段间有序。若将两个有序表合并成一个有序表,称为二路归并。(简单点说:类似于一颗倒着的二叉树,你需要先分解到只剩下一个元素(此时默认这个元素就是有序的了),然后往回合并,那么当你最后所分的左右两半有序了,在一归并,整体就有序了)
归并排序核心步骤:(分解是递归的过程:相当于二叉树的后续遍历,递归往回退是归并)
(单趟排序的思想:把一个数组的元素分成两半,在开辟一个临时的数组,对于前一半数组定义一个begin1和end1,对于后一半数组来说定义一个begin2和end2,让begin1和begin2的值比大小,谁小就把谁拿到那个临时开辟数组中,然后相应的那个begin++,直到一个先走到end,剩下的那个数组的元素直接取下来就好。)
1.1 完整代码
void _MergeSort(int* a,int left,int right,int* tmp)
{
if (left >= right)
return;
//首先应该分成两半
int mid = (left + right) / 2;
//[left,mid] [mid+1,right] 有序则可以直接合并,现在他们没有序,子问题解决
_MergeSort(a, left, mid, tmp);
_MergeSort(a, mid+1,right, tmp);
//归并
int begin1 = left, end1 = mid;
int begin2 = mid + 1, end2 = right;
int index = begin1; //这一步是为了能保持一致,让放到tmp数组里面的和原先位置一样
while (begin1 <= end1 && begin2 <= end2)
{
if (a[begin1] < a[begin2])
tmp[index++] = a[begin1++];
else
tmp[index++] = a[begin2++];
}
//此时说明有一个组已经走完了
while (begin1 <= end1)
tmp[index++] = a[begin1++];
while (begin2<= end2)
tmp[index++] = a[begin2++];
//把归并好的数据在拷贝回去
for (int i = left; i <= right; ++i)
{
a[i] = tmp[i];
}
}
//归并排序
void MergeSort(int* a, int n)
{
assert(a);
//这里归并的过程都是借助你所开辟的一大段空间来进行操作的
int* tmp = (int*)malloc(sizeof(int)*n);
_MergeSort(a,0,n-1,tmp);
free(tmp);
}
2.归并的非递归
易错点:
- 这里我们为了好去类比于递归的方式写非递归,也选择使用闭区间来控制边界,如何去想要思考清楚
- 对于gap的思考。开始会认为gap是1,然后是2,在是4…但是你会发现这种情况是理想状况下(刚好数组的元素能对分),比如:当你的数组只有6个数的时候你会发现你开始gap是1是没有问题的,但是当你的gap为2的时候,后面一组是不知道去和谁合的,并且你的第二组区间可能会存在越界。还有就是比如数组元素位7个的时候,4个一合,第二组区间只有部分,区间需要修正。
void MergeArr(int* a,int begin1, int end1, int begin2, int end2, int* tmp)
{
int left = begin1, right = end2;
int index = begin1;
while (begin1 <= end1 && begin2 <= end2)// 因为这里是闭区间所以要加=
{
if (a[begin1] < a[begin2])
tmp[index++] = a[begin1++];
else
tmp[index++] = a[begin2++];
}
//此时说明有一个组已经走完了
while (begin1 <= end1)
tmp[index++] = a[begin1++];
while (begin2 <= end2)
tmp[index++] = a[begin2++];
//把归并好的数据在拷贝回去
for (int i = left; i <= right; ++i)
{
a[i] = tmp[i];
}
}
//归并的非递归
void MergeSortNonR(int* a, int n)
{
assert(a);
int* tmp = (int*)malloc(sizeof(int) * n);
//怎样去控制这个gap,能让他们很好的归并?
int gap = 1;
while (gap < n)
{
for (int i = 0; i < n; i += 2 * gap) //这里的这个i控制,就是针对让它去合并后面的组
{
//此时先从一个一个归并开始思考,区间为[i,i+gap),[i+gap,i+2*gap) 开区间
//但是为了和相面的思考方式保持一致这里使用闭区间好一些[i,i+gap-1],[i+gap,i+2*gap-1]
int begin1 = i,end1 = i + gap - 1;
int begin2 = i + gap, end2 = i + 2 * gap - 1;//针对可能会越界的情况,去判断边界
//1.合并时只有第一组,那就不需要合并了
if (begin2 >= n)
break;
//2.合并时第二组只有部分数据,需要修正end2边界
if (end2 >= n)
end2 = n - 1;
MergeArr(a, begin1,end1,begin2,end2, tmp); //这只是合并了第一数和第二个数
}
gap *= 2;
}
free(tmp);
}
3. 排序算法复杂度及稳定性分析
(这里是有一个错误的,对于选择排序来说是不稳定的)
对于希尔排序来说,时间复杂度是O(N1.3 )~O( N2),这个是确定的,但是这个数值O(N1.3 )和O(nolgn)是非常接近的。所以有很多人认为这个数值是O(nlogn)
稳定性:数组中相同值,排完序相对顺序可以做到不变就是稳定的,否则就不稳定。