分类目录:《算法设计与分析》总目录
相关文章:
·堆(一):基础知识
·堆(二):维护堆的性质
·堆(三):建堆
·堆(四):优先队列
·排序算法:堆排序
·利用heapq模块实现堆
· 排序算法(一):插入排序
· 排序算法(二):归并排序
· 排序算法(三):堆排序
· 排序算法(四):选择排序
· 排序算法(五):冒泡排序
· 排序算法(六):希尔排序
· 排序算法(七):快速排序
\qquad
· ①基础知识
\qquad
· ②快速排序的性能
\qquad
· ③快速排序的随机化
\qquad
· ④快速排序的分析
· 排序算法(八):计数排序
· 排序算法(九):基数排序
· 排序算法(十):桶排序
· 排序算法:比较排序算法的下界
· 排序算法:十大排序算法总结
堆排序与归并排序一样,但不同于插入排序的是,堆排序的时间复杂度是 O ( n log n ) O(n\log n) O(nlogn)。而与插入排序相同,但不同于归并排序的是,堆排序同样具有空间原址性:任何时候都只需要常数个额外的元素空间存储临时数据。因此,堆排序是集合了我们目前已经讨论的两种排序算法优点的一种排序算法。
堆排序引入了另一种算法设计技巧:使用一种我们称为“堆”的数据结构来进行信息管理。堆的具体实现可以参考《算法设计与分析》系列中堆的部分,本文中的许多前置函数如max_heap(A)
、heapify(A, i)
等都在该系列的文章中提及。
初始时候,堆排序算法利用max_heap(A)
将输入数组
A
[
1
⋯
n
]
A[1\cdots n]
A[1⋯n]建成最大堆,其中
n
=
A
.
l
e
n
g
t
h
n=A.length
n=A.length,因为数组中的最大元素总在根结点
A
[
1
]
A[1]
A[1]中,通过把它与
A
[
n
]
A[n]
A[n]进行互换,我们可以让该元素放到正确的位置。这时候,如果我们从堆中去掉结点
n
n
n(这一操作可以通过减少
A
.
h
e
a
p
s
i
z
e
A.heap size
A.heapsize的值来实现),剩余的结点中,原来根的孩子结点仍然是最大堆,而新的根结点可能会违背最大堆的性质。为了维护最大堆的性质,我们要做的是调用heapify(A, i)
,从而在
A
[
1
⋯
n
−
1
]
A[1\cdots n-1]
A[1⋯n−1]上构造一个新的最大堆。堆排序算法会不断重复这一过程,直到堆的大小从
n
−
1
n-1
n−1降到2。
def heap_sort(arr):
n = len(arr)
# Build a maxheap.
for i in range(n, -1, -1):
heapify(arr, n, i)
# 一个个交换元素
for i in range(n-1, 0, -1):
arr[i], arr[0] = arr[0], arr[i] # 交换
heapify(arr, i, 0)
下图给出了一个在heap_sort(arr)
的第1行建立初始最大堆之后,堆排序操作的一个例子。图片显示了第2-4行for
循环第一次迭代开始前最大堆的情况和每一次迭代之后最大堆的情况。
heapSort(arr)
过程的时间复杂度是
O
(
n
log
n
)
O(n\log n)
O(nlogn),因为每次调用max_heap(arr)
的时间复杂度是
O
(
n
)
O(n)
O(n),而
n
−
1
n-1
n−1次调用heapify(A, i)
,每次的时间为
O
(
log
n
)
O(\log n)
O(logn)。
最后,我们用动图演示一下插入排序的全过程: