排序算法
在数据结构与算法中,常用的排序算法有如下6种:冒泡排序、选择排序、插入排序、快速排序、希尔排序以及归并排序。下面介绍第4种算法:快速排序。
快速排序
快速排序 (Quick Sort),又称为划分交换排序 (partition-exchange sort),通过一次排序把要排序的数据分割为独立的两个部分,其中一部分的所有数据比另外一部分的所有数据都要小,然后再按此方法对这两部分数据分别进行快速排序,整个排序过程可以递归进行,以此达到整个数据变成有序序列。
算法步骤
- 从数列中挑出一个元素,称为“基准”(pivot)。
- 重新排序数列,所有元素比基准值小的摆放在基准前面,所有元素比基准值大的摆在基准的后面(相同的数可以到任一边)。在这个分区结束之后,该基准就处于数列的中间位置。这个操作称为分区(partition)。
- 递归地把小于基准值元素的子数列和大于基准值元素的子数列进行排序。
递归的最底部情形,是数列的大小是零或一,也就是永远都已经被排好序了。虽然一直递归下去,但是这个算法总会结束,因为在每次的迭代中,它至少会把一个元素摆在它最后的位置去。
算法分析
Python 实现
def quick_sort(alist, start, end):
# 递归的退出条件
if start >= end:
return
# 设定起始元素为要寻找的基准元素
mid = alist[start]
low = start
high = end
while low < high:
# 如果 low 与 high 未重合,high 指向的元素不比基准元素小,则 high 向左移动。
while low < high and alist[high] >= mid:
high -= 1
alist[low] = alist[high]
while low < high and alist[low] < mid:
low += 1
alist[high] = alist[low]
# 退出循环后,low 与 high 重合,此时所指位置为基准元素的正确位置
# 将基准元素放在该位置
alist[low] = mid
# 对左边的子序列进行快排
quick_sort(alist, start, low-1]
# 对右边的子序列进行快排
quick_sort[alist, low + 1, end]
时间复杂度
- 最优时间复杂度 O ( n l o g n ) O(nlogn) O(nlogn)
- 最坏时间复杂度 O ( n 2 ) O(n^2) O(n2)
- 稳定性:不稳定
从一开始快速排序平均需要花费 O ( n l o g n ) O(n log n) O(nlogn)时间的描述并不明显。但是不难观察到的是分区运算,数组的元素都会在每次循环中走访过一次,使用 O ( n ) O(n) O(n)的时间。在使用结合(concatenation)的版本中,这项运算也是 O ( n ) O(n) O(n)。
在最好的情况,每次我们运行一次分区,我们会把一个数列分为两个几近相等的片段。这个意思就是每次递归调用处理一半大小的数列。因此,在到达大小为一的数列前,我们只要作 l o g n log n logn次嵌套的调用。这个意思就是调用树的深度是 O ( l o g n ) O(log n) O(logn)。但是在同一层次结构的两个程序调用中,不会处理到原来数列的相同部分;因此,程序调用的每一层次结构总共全部仅需要 O ( n ) O(n) O(n)的时间(每个调用有某些共同的额外耗费,但是因为在每一层次结构仅仅只有 O ( n ) O(n) O(n)个调用,这些被归纳在 O ( n ) O(n) O(n)系数中)。结果是这个算法仅需使用 O ( n l o g n ) O(n log n) O(nlogn)时间。