快速排序和归并排序的主要思想:分治
分治法的三个步骤:分解,解决,合并;我们将用分治思想设计排序算法
1.分解:把原本无序的数列分为两部分,对每部分,继续分解成更小的两部分……在快速排序中,是把序列分为左右两部分,左部分的元素都小于右部分的元素,快速排列的核心操作是分解;在归并排序中,是把序列简单的分为两半。
2.解决:分解到最后无法分解时,进行排序
3.合并:把每一次分开的两部分合并到一起。归并排序的核心操作是合并。快速排列并不需要合并过程,因为在分解过程中,左右部分就已经是有序的了。
一、快速排序
快速排序的函数如下:
void quick_sort(int l,int r){
//首先设置递归的终止条件
if(l>=r)return;
//分成子问题,并递归处理子问题
int i=l-1,j=r+1;
int x=q[l+r>>1];
while(i<j){ //注意点2
do i++;while(q[i]<x); //注意点3
do j--;while(q[j]>x); //注意点3
if(i<j)swap(q[i],q[j]);
}
quick_sort(l,j);
quick_sort(j+1,r);
//子问题合并,快排无需操作这一步,但归并排序需要
}
快排过程模拟 :
注意:
1.快排的主要思路是把序列分为左、右两部分,使得左边的所有数小于右边的所有数,递归这个过程,直到无法再分为止
2.如上图所示
3.如上图所示
4.时间复杂度
二、归并排序
思路:
1.分解:把初始序列分为长度相同的左右两个子序列,然后把每个子序列再分为更小的两个子序列……直到子序列只包含一个数。这个过程用递归实现。
2.求解子问题,对子序列排序。由于最底层的子序列只有一个数,以及每一次合并时,都将两个有序的子序列合并成一个有序的序列,所以其实无需进行这一步操作。
3.合并:归并两个有序的子序列。
归并排序的函数如下:
void merge_sort(int l,int r){
if(l>=r)return;
int mid=l+r>>1;
//分解成长度相同的左右两个子序列
merge_sort(l,mid);
merge_sort(mid+1,r);
//对子序列排序
//合并这两个有序的子序列
int i=l,j=mid+1,k=0;
while(i<=mid&&j<=r){
if(q[i]<=q[j])temp[k++]=q[i++];
else temp[k++]=q[j++];
}
while(i<=mid)temp[k++]=q[i++];
while(j<=r)temp[k++]=q[j++];
for(int i=l,j=0;i<=r;i++,j++)q[i]=temp[j];
}
归并过程模拟:
注意:
1.为什么指针j不能指向mid/为什么不能划分成 [ l , mid-1 ] 和 [ mid , r ]两个子区间?
因为mid = l + r >>1 向下取整,也就是当区间中有两个元素时,可能会出现无限划分的情况。
例如 l = 0 , r = 1 时 ,mid = 0 ,将会划分成 [ 0,-1 ]和 [ 0,1 ]两个区间,其中 [ 0,1 ] 区间会无限分割。
解决方法:让mid向上取整即可。即使mid = l + r +1>>1;
2.同理可得,归并排序的时间复杂度也为O(nlogn)
例题:逆序对的数量
给定一个长度为 n 的整数数列,请你计算数列中的逆序对的数量。
逆序对的定义如下:对于数列的第 i 个和第 j 个元素,如果满足 i<j且 a[i]>a[j],则其为一个逆序对;否则不是。
输入格式
第一行包含整数 n,表示数列的长度。
第二行包含 n 个整数,表示整个数列。
输出格式
输出一个整数,表示逆序对的个数。
数据范围
1≤n≤100000,
数列中的元素的取值范围 [1,109]。
输入样例:
6
2 3 4 5 6 1
输出样例:
5
分析:
该题如果用暴力方法解决,由于暴力解决的时间复杂度为O(n^2),很显然该题的数据范围较大,用暴力法会超时(C++代码中的操作次数不能超过10^8);
我们可以考虑是否可以用分治法来解决问题。首先是分解:对于样例 2 3 4 5 6 1,我们将其分解为左右两边长度相同的序列,直到无法再分解为止。
将每一次分开的两个序列按照由小到大合并到一起,于是每一个子序列的数字都按由小到大的顺序排列。那么问题可以转化为:对于每一个在右边子序列的数 q [ j ] ,存在多少个左边子序列的数 q [ i ],使得q [ j ] < q [ i ]。
代码如下:
#include<iostream>
using namespace std;
const int N=100010;
int q[N],temp[N];
int n;
long long res;
void merge_sort(int l,int r){
if(l>=r)return;
int mid=l+r>>1;
merge_sort(l,mid);
merge_sort(mid+1,r);
int i=l,j=mid+1,k=0;
while(i<=mid&&j<=r){
if(q[i]<=q[j])temp[k++]=q[i++];
else {
temp[k++]=q[j++];
res+=mid-i+1;//mid-i+1表示左部分比q[j]大的数有几个
}
}
while(i<=mid)temp[k++]=q[i++];
while(j<=r)temp[k++]=q[j++];
for(int i=l,j=0;i<=r;i++,j++)q[i]=temp[j];
}
int main(){
cin>>n;
for(int i=0;i<n;i++)cin>>q[i];
merge_sort(0,n-1);
cout<<res;
return 0;
}
注意:
1.数据范围上:该题的1≤n≤100000,n个数的逆序对数最多为n(n-1)/2 ,所以逆序对数最多有10^9~10^10个。int的数据范围约为2*10^9,所以不能用int型数据类型来定义逆序对数。可以用double或long long数据类型来定义逆序对数。(但是注意使用double类型时,要用printf语句进行输出,并且以%.0lf的输出格式来输出不带小数的double型数据)
排序的时间复杂度:
(图片来源)