快速排序让我想了挺久的了,也踩了一些坑,特在此记录把。
算法描述
- 在待排序的数组中选择一个元素作为基准(通常选择第一个元素),即基准元素;
- 将待排序的元素进行分区,比基准元素大的元素放在基准元素的右边,比基准元素小的元素放在基准元素的左边;
- 对左右两个分区再重新选择基准元素并进行分区,直到整个数组有序。
时间复杂度 (平均) | 时间复杂度(最坏) | 时间复杂度(最好) | 空间复杂度 | 稳定性 |
---|---|---|---|---|
O ( n l o g 2 n ) O(nlog_2 n) O(nlog2n) | O ( n 2 ) O(n^2) O(n2) | O ( n l o g 2 n ) O(nlog_2 n) O(nlog2n) | O ( l o g 2 n ) O(log_2n) O(log2n) | 不稳定 |
其实从表格中可以看出快速排序并不是在任何情况下都是最快的,在最坏情况下的复杂度和插入排序、选择排序等一样的,现在简单分析一下:
1、当分区选取的基准元素为待排序元素中的最大或最小值时,为最坏的情况,时间复杂度和直接插入排序的一样,移动次数达到最大值: C m a x = 1 + 2 + . . . + ( n − 1 ) = n ∗ ( n − 1 ) / 2 = O ( n 2 ) Cmax = 1+2+...+(n-1) = n*(n-1)/2 = O(n^2) Cmax=1+2+...+(n−1)=n∗(n−1)/2=O(n2) ,此时最好时间复杂为 O ( n 2 ) O(n^2) O(n2)
2.当分区选取的基准元素为待排序元素中的"中值",为最好的情况,时间复杂度为 O ( n l o g 2 n ) O(nlog2n) O(nlog2n)。
3.快速排序的空间复杂度为 O ( l o g 2 n ) O(log_2n) O(log2n)。
4.当待排序元素类似[6,1,3,7,3]且基准元素为6时,经过分区,形成[1,3,3,6,7],两个3的相对位置发生了改变,所是快速排序是一种不稳定排序。
当时在步骤2绕了很久,一直想不通如何进行分区,后来看了博客图解快速排序才有了较为清晰的认识,主要的过程如下图所示:
可以看出,快速排序实际上是一个"东拆西补"或者是"西拆东补"的过程。
代码描述
在这里先直接给出python的实现代码啦~~
def quick_sort(arr, orig_left, orig_right):
left, right = orig_left, orig_right
if left <= right: # 原数组至少有1个元素
datum_point = arr[left] # 取待排序数组的第1个元素为基准元素
while left < right:
while left < right and arr[right] >= datum_point:
right -= 1
arr[left] = arr[right] # 找到右边第1个小于基准的元素并于左边的替换
while left < right and arr[left] <= datum_point:
left += 1
arr[right] = arr[left] # 找到左边第1个大于基准的元素并与右边的替换
arr[right] = datum_point # 将基准元素归位
quick_sort(arr, orig_left, right-1) # 对左边的重复快排
quick_sort(arr, right+1, orig_right) # 对右边的重复快排
return arr
if __name__ == '__main__':
arr = [54, 26, 93, 17, 77, 31, 44, 55, 20]
orig_left, orig_right = 0, len(arr)-1
print(quick_sort(arr, orig_left, orig_right))
我当时有一个困惑就是为什么在左(右)边选了基准元素之后,一定要从另一边开始扫描呢?后来经过画图分析和代码验证,明白了:
如果一开始基准选在左边 datum_point = arr[left],那么首先应该从右边比较,反之亦然。
因为基准选在左边,相当于左边空出来一个位置用于存放右边小于基准的数,如果一开始就从左边比较,那么右边并没有空出来位置,
当左边扫瞄到大于基准的数,则只能替换掉右边的数,这样右边原来的数就会从数组中移除,导致原数组的元素有所丢失。
参考博客: 图解快速排序 (https://www.cnblogs.com/MOBIN/p/4681369.html)