堆排序(Heap Sort)
堆排序是利用堆这种数据结构而设计的一种排序算法,堆排序是一种选择排序,它的最坏,最好,平均时间复杂度均为O(nlogn),它是不稳定排序。首先简单了解下堆结构。
堆
堆是具有以下性质的完全二叉树:每个结点的值都大于或等于其左右孩子结点的值,称为大顶堆;或者每个结点的值都小于或等于其左右孩子结点的值,称为小顶堆。如下图:
同时,我们对堆中的结点按层进行编号,将这种逻辑结构映射到数组中就是下面这个样子
该数组从逻辑上讲就是一个堆结构,我们用简单的公式来描述一下堆的定义就是:
大顶堆:arr[i] >= arr[2i+1] && arr[i] >= arr[2i+2]
小顶堆:arr[i] <= arr[2i+1] && arr[i] <= arr[2i+2]
还有一个基本概念:查找数组中某个数的父结点和左右孩子结点,比如已知索引为i的数,那么
1.父结点索引:(i-1)/2(这里计算机中的除以2,省略掉小数)
2.左孩子索引:2*i+1
3.右孩子索引:2*i+2
算法描述
- 将初始待排序关键字序列(R1,R2….Rn)构建成大顶堆,此堆为初始的无序区;
- 将堆顶元素R[1]与最后一个元素R[n]交换,此时得到新的无序区(R1,R2,……Rn-1)和新的有序区(Rn),且满足R[1,2…n-1]<=R[n];
- 由于交换后新的堆顶R[1]可能违反堆的性质,因此需要对当前无序区(R1,R2,……Rn-1)调整为新堆,然后再次将R[1]与无序区最后一个元素交换,得到新的无序区(R1,R2….Rn-2)和新的有序区(Rn-1,Rn)。不断重复此过程直到有序区的元素个数为n-1,则整个排序过程完成。
动图演示
代码实现
以下实现中,为了方便堆操作,数组从标号1开始,则父结点索引为i/2,左孩子索引为2*i,而右孩子索引为2*i + 1
// 元素下降操作 大顶堆(大根堆)
void heap_down(vector<int> &heap, int size, int i) {
int t = i;
int left = 2 * i, right = 2 * i + 1;
// 如果比左孩子或者右孩子小,需要下降
if (left <= size && heap[left] > heap[t]) { t = left; }
if (right <= size && heap[right] > heap[t]) { t = right; }
if (t != i) {
swap(heap[i], heap[t]);
heap_down(heap, size, t);
}
}
// 元素上升操作 大顶堆(大根堆)
void heap_up(vector<int> &heap, int i) {
while (i / 2 && heap[i] > heap[i / 2]) {
swap(heap[i], heap[i / 2]);
i = i / 2;
}
}
// 堆排序
void heap_sort(vector<int> &heap, int n) {
int size = n;
// 构建堆,生成一个大顶堆
for (int i = 1; i <= n; ++i) {
heap_up(heap, i);
}
// 大顶堆的堆顶元素为最大元素,每次和最后的元素交换,并且size-1,
// 相当于从当前堆中剔除堆顶最大元素,然后再对交换后的堆顶元素执行下降操作,重新维护一个堆
for (int i = 1; i <= n; ++i) {
swap(heap[1], heap[size]);
--size;
heap_down(heap, size, 1);
}
}
算法分析
最坏,最好,平均时间复杂度均为O(nlogn),同时它是不稳定排序。空间复杂度为O(1)。