归并排序是由递归实现的,主要是分而治之的思想,也就是通过将问题分解成多个容易求解的局部性小问题来解开原本的问题的技巧。
另外,归并排序在合并两个已排序数组时,如果遇到了相同的元素,只要保证前半部分数组优先于后半部分数组, 相同元素的顺序就不会颠倒。所以归并排序属于稳定的排序算法。
这里多说一句,分而治之和减而治之是有区别的。
- 分而治之是将一个问题分成两个或多个子问题(即两个或多个范围较小递归)
solve(left, right){
int mid = (left + right) / 2;
return max(solve(left, mid), solve(mid, right));
}
- 减而治之的意思是将一个问题分解成一个范围较小的递归和一个可以一步求解的平凡子问题,比如求n!
solve(n){
return n * solve(n - 1);
}
废话不多说,先给代码:
#include <bits/stdc++.h>
using namespace std;
#define MAX 500000
#define SENTINEL 2000000000
int L[MAX/2+2], R[MAX/2+2];
int cnt;
void merge(int A[], int left, int mid, int right){
int n1 = mid - left;
int n2 = right - mid;
for (int i = 0; i < n1; i++) L[i] = A[left+i];
for (int i = 0; i < n2; i++) R[i] = A[mid+i];
L[n1] = R[n2] = SENTINEL;
int i = 0, j = 0;
for (int k = left; k < right; k++){
cnt++;
if (L[i] <= R[j]){
A[k] = L[i++];
} else {
A[k] = R[j++];
}
}
}
void mergeSort(int A[], int left, int right){
if (left+1 < right){
int mid = (left+right)/2;
mergeSort(A, left, mid);
mergeSort(A, mid, right);
merge(A, left, mid, right);
}
}
int main(){
int A[MAX], n, i;
cnt = 0;
cin >> n;
for (i = 0; i < n; i++) cin >> A[i];
mergeSort(A, 0, n);
for (i = 0; i < n; i++){
if (i) cout << ' ';
cout << A[i];在这里插入图片描述
}
cout << endl;
cout << cnt << endl;
return 0;
}
这个是《挑战程序设计竞赛》中的代码,我觉着它设计的相比于B站还有其他地方看到的都妙,别的代码都是将原序列分成单个元素后在合并,而这个最终只会分到三个一组,mergeSort分成(left, mid)和 (mid, right),也不会有重叠。
奇数情况下
偶数情况下也非常类似:
最后再讲一下merge的过程,就拿奇数情况下最后一次merge来说吧
(即黄底绿字右边标注的4,这一过程)
对照代码方便看
void merge(int A[], int left, int mid, int right){
int n1 = mid - left;
int n2 = right - mid;
for (int i = 0; i < n1; i++) L[i] = A[left+i];
for (int i = 0; i < n2; i++) R[i] = A[mid+i];
L[n1] = R[n2] = SENTINEL;
int i = 0, j = 0;
for (int k = left; k < right; k++){
cnt++;
if (L[i] <= R[j]){
A[k] = L[i++];
} else {
A[k] = R[j++];
}
}
}
时间复杂度分析:
使用主定理公式: T ( n ) = a ∗ T ( n / b ) + O ( f ( n ) ) T(n) = a * T(n / b) + \Omicron(f(n)) T(n)=a∗T(n/b)+O(f(n))
其中:
- T ( n ) T(n) T(n) 为规模为n的问题需要的时间
- a a a 为分成a个子问题
- T ( n / b ) T(n / b) T(n/b) 为每个子问题要用的时间
- O ( f ( n ) ) \Omicron(f(n)) O(f(n)) 为任务分解、合并的时间复杂度
主定理就是比较 f ( n ) f(n) f(n) 和 n l o g a b n^{log_a^b} nlogab
如果
- f ( n ) < n l o g a b f(n) < n^{log_a^b} f(n)<nlogab,则 T ( n ) = O ( n l o g a b ) T(n) =\Omicron(n^{log_a^b}) T(n)=O(nlogab)
- f ( n ) f(n) f(n) 与 n l o g a b n^{log_a^b} nlogab 同阶,则 T ( n ) = O ( n l o g a b ∗ l o g n ) T(n) =\Omicron(n^{log_a^b} * logn) T(n)=O(nlogab∗logn)
- f ( n ) > n l o g a b f(n) > n^{log_a^b} f(n)>nlogab,则 T ( n ) = O ( f ( n ) ) T(n) =\Omicron(f(n)) T(n)=O(f(n))
归并排序中,一共分为两个子问题,每个子问题所要用的时间为原问题的一半,分解、合并用的时间复杂度为 O ( n ) \Omicron(n) O(n)
所以 T ( n ) = 2 ∗ T ( n / 2 ) + O ( n ) T(n) = 2 * T(n / 2) + \Omicron(n) T(n)=2∗T(n/2)+O(n)
f
(
n
)
=
n
f(n) = n
f(n)=n
n
l
o
g
a
b
=
n
l
o
g
2
2
=
n
n^{log_a^b} = n^{log_2^2} = n
nlogab=nlog22=n
f ( n ) f(n) f(n) 与 n l o g a b n^{log_a^b} nlogab 同阶, 故归并排序的时间复杂度 T ( n ) = O ( n l o g a b ∗ l o g n ) = O ( n l o g 2 2 ∗ l o g n ) = O ( n l o g n ) T(n) =\Omicron(n^{log_a^b} * logn) = \Omicron(n^{log_2^2} * logn) = \Omicron(nlogn) T(n)=O(nlogab∗logn)=O(nlog22∗logn)=O(nlogn)
参考书籍:
[1] (日)渡部有隆. 挑战程序设计竞赛 2 算法和数据结构. 北京:人民邮电出版社, 2016.09.