提要:
快速排序是基于分治的思想实现的排序算法,对于一个无序数列,我们从中选取一个基数,然后把小于基数的所有数字放到基数前面,大于基数的数字放在基数后面,然后对基数左右的子序列进行同样的操作,最终获得有序数列。
代码:
#include<iostream>
using namespace std;
void sort(int a[],int l, int r){
if (l>=r) return;
int i=l;
int j=r;
srand(time(0));
int k=rand()%(j-i+1)+i; //取[l,r]的随机数
int key=a[k]; //基数
a[k]=a[l]; //腾出a[l]这个位置用于交换
while (i<j){
while (i<j && a[j]>=key) j--;
a[i]=a[j];
while (i<j && a[i]<=key) i++;
a[j]=a[i];
}
a[i]=key; //最终i==j 且这就是key的最终位置
sort(a,l,i-1);
sort(a,i+1,r);
}
int main(){
int a[]={6,1,2,4,5,8,7,3,5,0,5,10,55};
int n=13;
for (int i=0; i<n; i++) cout<<a[i]<<" "; cout<<endl;
sort(a,0,n-1);
for (int i=0; i<n; i++) cout<<a[i]<<" "; cout<<endl;
}
代码解释:
首先sort函数的定义是对a数组的[l,r]区间排序(左闭右闭),所以我们看到在主函数调用时,传入参数是0,n-1。
代码第5行,首先对于递归区间 l>=r 的,不需要排序了直接return。
然后接着定义了左右指针 i j (因为 l,r 作为我们的边界在后续的分治过程还需要使用)。
基数的选择有很多种,取头取尾还是取中间都可能被卡掉,所以这里用的 rand() 取基数,k为选定的基数下标,key为基数。
代码11行 a[k]=a[l] 和代码18行 a[i]=key,这两个语句要连起来看:
代码12的while,最终会使得 i,j 停留在一个位置,并且那个位置是key的最终归宿,那么对于交换本身操作来说,需要一个“空杯子”temp来倒腾一下,这里的 a[k]=a[l] 就是把 a[l] 这个位置空出来(因为 a[k] 我们已经存在key中了),a[l] 空出来以后,下面的第一次查找一定是 j 不能是 i,要先去覆盖 a[i] 也就是 a[l],再用 a[j]=a[i] 覆盖,如此循环,最终 i==j ,也就是找到了最终key的位置。所以有代码18行的a[i]=key。
思考和优化:
当在扫描过程中遇到了和基数一样大小的数字会怎么样?
对于与基数相等的数字,程序会他们和其他数字一样对待(因为我们特判数字相等的情况),这样最终的左右区间的划分中可能都存在与基数相同的数字。
例如原始区间是【0,12】。第一次选择的基数是5,一次区间排完序变成【0,6】【7,12】,在两个区间中,我们都发现了基数5。
可以这么说,sort函数一次实现的目标是把比基数小或者相等的数移动到基数之前,比基数大或者相等的数移动到基数之后,并且自己最终的位置正确的,至于与基数相等的那些数字,在左右区间中都可能出现。
优化:针对上述的遇到与基数相等的情况,有人实现了一种三路快排,也就是在原来大于基数、小于基数两种情况考虑的基础上,加上了等于基数的考虑,这种改进会让快排常数更小,但是复杂度不变。
另一种古老的写法:源自pascal代码库
#include<iostream>
using namespace std;
void sort(int a[],int l, int r){
int i=l;
int j=r;
srand(time(0));
int k=rand()%(j-i+1)+i; //取[l,r]的随机数
int key=a[k]; //基数
while (i<j){
while (a[i]<key) i++; //找到大于基数的
while (a[j]>key) j--; //小于基数的
if (i<=j) {
swap(a[i],a[j]); //交换
i++;
j--;
}
}
if (l<j) sort(a,l,j);
if (i<r) sort(a,i,r);
}
int main(){
int a[]={5,1,2,4,5,8,5,3,5,0,5,10,55};
int n=13;
for (int i=0; i<n; i++) cout<<a[i]<<" "; cout<<endl;
sort(a,0,n-1);
for (int i=0; i<n; i++) cout<<a[i]<<" "; cout<<endl;
}
解释:
区别只要在第10行while循环.这里是先找到一个小于基数的和大于基数的,然后交换他们。
交换这里有几个问题需要注意:
1.为什么需要先特判 i<=j ? 答:因为上述两个查找的while循环并没有加i<j的条件,所以可能出现 j>i 的情况,显然这种情况我们是不需要交换的,直接退出就好。
2.为什么是 i<=j 而不是 i<j ? 也就是说,一个数字和它本身交换有意义吗?答: 交换本身没有意义,重要的是为了执行交换下面的 i++,j-- 语句,想象一下 i,j 指向同一个数字,我们把需要再一次i++,j--才能退出,否则会出现死循环。
区别:
这两种方法的区别在于交换的过程。方法一是在查找途中就实现交换。方法二是在找到需要交换的两个元素后,交换。
体现在结果上就是方法一在选择基数执行一次排序后,基数处在正确的位置,并且 i,j 指针结束的位置就是基数的位置。
方法二在选择基数执行一次排序后,基数虽然处在正确位置,但你无法得知,只知道区间被划分为 [l,j] 和 [i,r]两部分(想要知道得再扫描一遍数组);
这个区别在快速排序中是没有影响的,但是在快速选择算法中,我们是需要得知基数的位置的。