何谓归并排序,先看下面一个例子:
设有数列{6,100,38,202,100,301,38,8,1}
初始状态:{6},{100},{38},{202},{100},{301},{38},{8},{1}
第一次归并后:{6,100},{38,202},{100,301},{8,38},{1};
第二次归并后:{6,38,100,202},{8,38,100,301},{1};
第三次归并后:{6,8,38,38,100,100,202,301},{1};
第四次归并后:{1,6,8,38,38,100,100,202,301}
最终结果得出:{1,6,8,38,38,100,100,202,301}
归并排序是一种稳定且高效的排序算法,时间复杂度为O(nlog2n) ,一般按照三步走:
1.划分问题:把序列分成元素个数尽量相等的两个序列
2.递归求解:对两个序列分别排序
3.合并问题:把两个有序序列合并为一个序列
前两步很容易实现,关键在于第三步,怎么合并呢? 很简单,每次只需把左右两个有序序列的最小元素进行比较,把其中较小的元素加入到合并后的辅助数组中即可。示例代码如下:
//归并排序
#include<bits/stdc++.h>
using namespace std;
#define N 1000005
int a[N] ,b[N];//b为辅助数组
/**
* 对a数组中[l,r]区间内的元素进行排序
*
* @param l 区间左边界,闭区间
* @param r 区间右边界,闭区间
*/
void merge_sort(int l , int r)
{
// 如果整个区间中元素个数大于1,则继续分割
if(r-l > 0)
{
int mid = (l+r) / 2;
// 1、划分为2个尽可能相等的区间并排序
merge_sort(l , mid);
merge_sort(mid+1 , r);
// printf("%d-%d %d-%d\n",p,mid ,q ,r);
// 2、将2个有序的序列进行合并
int i = l; // 辅助数组的下标
int p = l , q = mid+1; // p、q指针分别指向2个有序序列的首个元素
while(p<=mid || q<=r) //左右两部分只要有一部分不为空,就还需循环
{
if(q>r || (p<=mid && a[p]<=a[q])) // 从左半数组复制到辅助数组后p指针后移
b[i++] = a[p++];
else b[i++] = a[q++]; // 从右半数组复制到辅助数组后q指针后移
}
// 3、将辅助数组b中排好序的元素复制到a中,即a中[l,r]区间内的元素已经有序
for(i = l ; i <= r; i++)
a[i] = b[i];
}
}
int main()
{
int n;
while(cin >> n)
{
for(int i = 1 ; i <= n; i ++)
cin >> a[i];
merge_sort(1 , n);
for(int i = 1; i <= n; i++)
cout << a[i] << " ";
cout << endl;
}
return 0;
}
求序列的逆序对,先看下面的例子:
设有数列{6,100,38,202,100,301,38,8,1}
初始状态:{6},{100},{38},{202},{100},{301},{38},{8},{1}
第一次归并后:{6,100},{38,202},{100,301},{8,38},{1};比较次数:4,逆序对数:1
第二次归并后:{6,38,100,202},{8,38,100,301},{1};比较次数:5,逆序对数:5
第三次归并后:{6,8,38,38,100,100,202,301},{1};比较次数:6,逆序对数:6
第四次归并后:{1,6,8,38,38,100,100,202,301}:比较次数:1,逆序对数:8
总的比较次数为:4+5+6+1=16 逆序对数目为:1+5+6+8 = 20
根据归并排序的特性(左右两部分的有序序列合并时,假设i在左边,j在右边,对于右边的j,统计左边比它大的元素个数f(j),则f(j) = mid-i+1 ,合并完所有的序列时即可得出答案,即f(j)之和便是答案),只需将上面的代码修改一处:把“else b[i++] = a[q++];”改成“ else {b[i++] = a[q++]; cnt += mid-p+1;}" ,注意在调用之前将cnt清零。
归并排序是一种稳定的排序方法:在合并两个有序序列时,若左边序列中有元素与右边序列中某个元素相等,这时只需将左边序列的元素填充至辅助数组并将指针后移,右边指针不动,即可保证排序的稳定性。
//归并排序及求逆序对
#include<bits/stdc++.h>
using namespace std;
#define N 1000005
int a[N] ,b[N];//b为辅助数组
long long cnt;
void merge_sort(int l , int r)
{
// 如果整个区间中元素个数大于1,则继续分割
if(r-l > 0)
{
// 1、尽量划分为数量相等的2个子序列,并排序
int mid = (l+r) / 2 ;
merge_sort(l , mid);
merge_sort(mid+1 , r);
//printf("%d-%d %d-%d\n",p,mid ,q ,r);
// 2、将2个有序的序列合并成一个有序序列
int i = l; // 辅助数组的下标
int p = l , q = mid+1; // p、q分别指向2个序列的头部
while(p<=mid || q<=r) // 左右两部分只要有一部分不为空,需要继续合并
{
if(q>r || (p<=mid && a[p]<=a[q])) // 从左半数组复制到辅助数组
b[i++] = a[p++];
else
{
b[i++] = a[q++];
cnt += mid -p + 1; // 将逆序对的个数累加起来,f(q) = mid - p + 1
}
}
// 3、将辅助数组b中排好序的元素复制到a中
for(i = l ; i <= r; i++)
a[i] = b[i];
}
}
int main()
{
int n;
while(cin >> n)
{
for(int i = 1 ; i <= n; i ++)
cin >> a[i];
cnt = 0;
merge_sort(1 , n);
for(int i = 1; i <= n; i++)
cout << a[i] << " ";
cout << endl;
cout << "逆序对有:" << cnt <<endl;
}
return 0;
}
下面是JAVA版本的示例代码:
/**
* 求arr数组中[l,r]区间内的逆序对,并排序
*
* @param arr 目标数组
* @param l 区间左边界
* @param r 区间右边界
* @return arr数组中[l, r]区间内的逆序对数量
*/
public int mergeSort(int[] arr, int l, int r) {
// l == r时表示已经递归到最底层,无需再分割序列
if (l == r) {
return 0;
}
// 1、将[l,r]区间进行均等分割,并排序
int mid = (l + r) / 2;
int ansL = mergeSort(arr, l, mid);
int ansR = mergeSort(arr, mid + 1, r);
// 2、将两个有序序列[l,mid]、[mid+1,r]进行合并,使[l,r]区间有序
// 辅助数组
int[] fuZhu = new int[r - l + 1];
// p、q分别指向两个有序序列的头部,tmpAns记录这次合并操作计算得到的逆序对,i为辅助数组下标
int p = l, q = mid + 1, tmpAns = 0, i = 0;
while (p <= mid || q <= r) {
/**
* q > r,说明一定有 p <= mid,说明右半部分已全部合并
* arr[p] <= arr[q]其中的等于是稳定排序的关键,也是当序列中存在重复元素仍能正确计算出逆序对的关键
*/
if (q > r || (p <= mid && arr[p] <= arr[q])) {
fuZhu[i++] = arr[p++];
} else {
fuZhu[i++] = arr[q++];
tmpAns += mid - p + 1;
}
}
// 3、将辅助数组复制到arr的[l,r]区间
for (int j = 0; j < fuZhu.length; j++) {
arr[l + j] = fuZhu[j];
}
return ansL + ansR + tmpAns;
}
@Test
public void test() {
// int[] arr = {6,202,100,301,38,8,1};
int[] arr = {6, 100, 38, 202, 100, 301, 38, 8, 1};
int total = mergeSort(arr, 0, arr.length - 1);
System.out.println("逆序对数目:" + total);
for (int item : arr) {
System.out.println(item);
}
}
当然求逆序对还可以用树状数组求解