快速排序是Hoare于1962年提出的一种二叉树结构的交换排序方法。值得一提的是,大佬现在依旧活跃在学术界。
快速排序简介
我们先来粗略了解一下快速排序的思路:
其基本思想为:任取待排序元素序列中的某元素作为基准值,按照该排序码将待排序集合分割成两子序列,左子序列中所有元素均小于基准值,右子序列中所有元素均大于基准值,然后最左右子序列重复该过程,直到所有元素都排列在相应位置上为止。
// 假设按照升序对array数组中[left, right)区间中的元素进行排序
void QuickSort(int array[], int left, int right)
{
if(right <= 1+left)
return;
// 按照基准值对array数组的 [left, right)区间中的元素进行划分
int div = partion(array, left, right);
// 划分成功后以div为边界形成了左右两部分 [left, div) 和 [div+1, right)
// 递归排[left, div)
QuickSort(array, left, div);
// 递归排[div+1, right)
QuickSort(array, div+1, right);
}
上述为快速排序递归实现的主框架,发现与二叉树前序遍历规则非常像,同学们在写递归框架时可想想二叉树前序遍历规则即可快速写出来,后序只需分析如何按照基准值来对区间中数据进行划分的方式即可
基准值划分法
将区间按照基准值分为左右两半有几种常见的方式:
1. hoare版本
选定一个keyi值 为我们的基准值的下标,我们这里先暂时将啊数组第一个元素作为基准值,也就是keyi=0
我们的目的是把小于a[keyi]的值放在一边,大于a[keyi]的值放在另外一边。
我们利用left和right两个 移动下标 ,left往右移动 ,right往左移动。
- 先走right,当a[right]比a[keyi]小,停止移动,再走left,当a[left]比a[keyi]大,停止移动。
- 我们将a[right]与a[left]交换.
- 继续步骤1,2,直到left和right之间没有元素存在
- 将a[left]与a[keyi]交换
再者,我们还有一个问题,关于keyi的取值,我们该以什么标准选择。
代码如下:
int PartSort_1(int* a, int left, int right)
{
int mid = GetMidIndex(a, left, right);
swop(&a[left], &a[mid]);
int keyi = left;
while (left < right)
{
//左边做key,右边先走找小
while (a[right] >= a[keyi]&&left<right)
{
right--;
}
//swop(&a[left], &a[right]);
//左边再走,找大
while (a[left] <= a[keyi]&&left<right)
{
left++;
}
//交换,把大的换到右边,把小的换到左边
swop(&a[left], &a[right]);
}
swop(&a[left], &a[keyi]);
return left;
}
这时候有同学会产生疑问,为什么我反复强调right要先走?
其实这不是偶然的,如果我们让left先走,会给逻辑判断造成难度。
2. 挖坑法
挖坑法 是 hoare版本 的2.0 ,它的思路更加易于理解。
- 选定一个key作为基准值
- 选定一个移动下标hole(坑),初始位置在数组最左边
- 与hoare法类似,设置left和right两个移动下标
- right先走,当找到a[right]<key的时候停止,将a[right]填入hole这个位置中,这个时候right这个位置就“空”了,就变成了hole.
- left后走,当找到a[left]<key的时候停止,将将a[left]填入hole这个位置中,这个时候left这个位置就“空”了,就变成了hole.
- 重复 步骤4与步骤5 ,当不满足left<right的时候,停止。
- 此时hole依然存在,我们将key填入其中
- 返回hole
完整的代码为:
int PartSort_2(int* a, int left, int right)
{
int midi = GetMidIndex(a, left, right);
swop(&a[left], &a[midi]);
int key = a[left];
int hole = left;
while (left < right)
{
while (a[right] > key&&left<right)
{
right--;
}
// 把右边找的小的,填到左边的坑,自己形成新的坑
a[hole] = a[right];
hole = right;
while (a[left] < key&&left<right)
{
left++;
}
// 把左边找的大的,填到右边的坑,自己形成新的坑
a[hole] = a[left];
hole = left;
}
a[hole] = key;
return hole;
}
3. 前后辈指针版本
第三种,与前两中的思路就不太一样了。大家可以了解一下:
- 选取左边作为key (基准值)
- 设置两个 移动下标 prev和cur,他们的初始位置分别在数组第一位和第二位。
- cur往前走,此时分两种情况:
- 找到比key小的数据,停下来,++prev,交换prev和cur指向位置的值,但是如果两个下标相邻就不交换。
- 找到比key大的数据,继续往前走,直到找到比key小的数
- 当cur走到数组的结尾,结束。
- 讲prev位置的值与key做交换
这样讲有点抽象,我们依旧是看图说话:
依照这种方法,我们可以得出代码:
int PartSort3(int* a, int left, int right)
{
int midi = GetMidIndex(a, left, right);
Swap(&a[left], &a[midi]);
int keyi = left;
int prev = left;
int cur = prev + 1;
while (cur <= right)
{
if (a[cur] < a[keyi] && ++prev != cur)
Swap(&a[prev], &a[cur]);
++cur;
}
Swap(&a[prev], &a[keyi]);
return prev;
}
如果说,我们将key值设置为初始数组最右边的值(在本例子中为8),这种方法也是可以的,不过我们需要注意几个细节:
1. prev和cur的初始位置发生变化:
2. 接近判断结束时,有些许变化。
我们还是以之前的数组为例子:
*基准值的选取
细心的同学会发现,在我给出的三种方法中,在开头都有一段意义不明的代码:
int midi = GetMidIndex(a, left, right);
Swap(&a[left], &a[midi]);
这段代码是什么意思呢?
这就要引出一个问题:基准数字的选择。
在之前我们选择的是最左边的数字作为基准数,这是没有问题的,但是在某些情况下,基准数的不合理选择会影响快速排序的效率。
当面对数据量较大的数组接近有序的情况之下,我们来测试一下快速排序以及其他排序的相对运算时间:
我们发现快排在数组有序的情况下劣势十分明显,这就是由于我们在数组有序的状态下依然选择最左边为基准数:
可以看出,这种情况下,其算法的优势完全没有显现出来。
所以,有人提出了 “三数取中法”:
我们在数组中比较a[left],a[midi],a[right]三个数字,mid=(left+right),我们取三数中的位于中间值的数作为基准数。
我们再测试一下,其相对的时间:
可以看到,快速排序 又变的 很快了。
基于递归的快速排序
经过一次基础值划分法之后,我们的数组相对变得有序了一些,但这对我们完全不够。
但是,如果我们不断的划分,是否会使数组最终有序呢?这就是最初的快速排序的基本思路。
其基本思想为:任取待排序元素序列中的某元素作为基准值,按照该排序码将待排序集合分割成两子序列,左子序列中所有元素均小于基准值,右子序列中所有元素均大于基准值,然后最左右子序列重复该过程,直到所有元素都排列在相应位置上为止。
我们来看一下,递归的代码:
void quick_sort(int* a, int left,int right)
{
if (left >= right)
return;
int keyi = PartSort_1(a, left, right);
//Print(a+left,right-left+1);
quick_sort(a, left, keyi-1);
quick_sort(a, keyi + 1, right);
}
我们依旧画图来 加深一下理解:
我们先把递归的过程打印出来:
同时这个图也可以解释为什么当left >= right我们不再递归下去:
我们截取这张图递归的底部:
我们可以发现此时keyi=0(a[keyi]=1),左边的区间是空的,这造成了左边绿色区域left>right的情况,而此时右边的区域是只有一个元素,这造成了橙色区域left==right的情况。
综上我们可以总结:
- 区间为空,表现为left>right
- 区间里只有一个元素,表现为left==right
我们完全可以将这种过程理解为二叉树的递归:
非递归的快速排序
看完递归实现的快速排序,我们现在面临一个问题:
递归程序的通病,会有相对循环迭代程序的问题
- 递归的深度太深,导致栈溢出
- 性能问题,不过现在编译优化的很好,问题不大。
所以我们可以考虑使用非递归的方式去实现,用非递归的方式去实现递归的程序,一般有两种方法:
1. 循环
3. 栈+循环·
这里我们使用栈来实现:
我们依次把需要单趟排的区间入栈,再依次取出栈里面的区间出来单趟排,再把需要处理的子区间入栈
我们依旧是用图说话:
ps:图比较大,点开来放大看就行了。
这里可能还会有些同学思考我们将区间 入栈的判断标准是什么?
1.对于右区间,如果keyi + 1 < end,那么我们就入栈
2. 对于左区间,如果keyi-1>begin,那么我们就入栈
为什么?因为我们入栈的区间,当我们去除的时候,必须保证至少区间中有两个数据,空区间或单元素区间对于我们来说没有排序的必要。
由此我们可以得出
void quickSortNonR(int* a, int left, int right)
{
//依次把需要单趟排列的区间入栈
//依次取栈里面的区间出来单趟排
//再把需要处理的子区间入栈
ST st;
StackInit(&st);
StackPush(&st, right);
StackPush(&st, left);
while (!StackEmpty(&st))
{
int begin = StackTop(&st);
StackPop(&st);
int end = StackTop(&st);
StackPop(&st);
int keyi = PartSort_1(a, begin, end);
//保证要有区间存在(类递归的返回条件)
if (keyi + 1 < end)
{
StackPush(&st, end);
StackPush(&st, keyi+1);
}
if (begin < keyi - 1)
{
StackPush(&st, keyi-1);
StackPush(&st, begin);
}
}
StackDestroy(&st);
}
到这里,我们就讲完了有关快速排序的所有常用知识点。