堆排序
堆排序是利用堆这种数据结构而设计的一种排序算法,堆排序是一种选择排序,它的最坏,最好,平均时间复杂度均为O(nlogn),它也是不稳定排序,要了解堆排序首先要了解什么是堆,堆在计算机里的数据是怎样存放的,这里以大根堆为例子讲解一下,小根堆相反。
堆
了解堆之前还要了解什么是完全二叉树, 完全二叉树:一棵深度为k的有n个结点的二叉树,对树中的结点按从上至下、从左到右的顺序进行编号,如果编号为i(1≤i≤n)的结点与满二叉树中编号为i的结点在二叉树中的位置相同,则这棵二叉树称为完全二叉树。堆是具有以下性质的完全二叉树:每个结点的值都大于或等于其左右孩子结点的值,称为大顶堆;或者每个结点的值都小于或等于其左右孩子结点的值,称为小顶堆。
还要注意一定,完全二叉树在计算机中的实现方式,因为是完全二叉树,所以实现方式和其他的二叉树实现方式不大相同,在计算机中我们用一个数组实一个堆的物理存储结构,这样在数组中的每一个下标i
他的左孩子
2
∗
i
+
1
2*i+1
2∗i+1
右孩子
2
∗
i
+
2
2*i+2
2∗i+2
父节点:
i
−
1
2
\frac{ i-1}{2}
2i−1
如图所示:
堆排序实现
堆排序的基本思想是:
1、将序列构造成一个大顶堆,此时,整个序列的最大值就是堆顶的根节点;
2、将其与末尾元素进行交换,此时末尾就为最大值;
3、然后将剩余n-1个元素重新构造成一个堆,这样会得到n个元素的次小值;
4、如此反复执行,便能得到一个有序序列。
1、构造大根堆
假定一个无序结构如下:
1、此时我们从最后一个非叶子结点开始(叶结点自然不用调整,第一个非叶子结点 arr.length/2-1=5/2-1=1,也就是下面的4结点),从左至右,从下至上进行调整:
2、找到第二个非叶节点3,由于[3,7,0]中7元素最大,3和7交换:
这时,交换导致了子根[3,2,4]结构混乱,继续调整,[3,2,4]中4最大,交换3和4:
重复这样的步骤,就调整好一个大根堆了:上面的做法的实现代码如下:
void heapify(int *arr,int indx,int heapsize){
int left = 2*index+1;
while(left<heapsize){
int largestindex= left+1<heapsize && arr[left] < arr[left+1]? left+1:left;
largestindex = arr[largestindex]>arr[index]? largestindex:index;
if(largestindex==index)
break;
swap(arr,index,largestindex);
index = largestindex;
left = 2*index+1;
}
}
完整的堆排序代码:
void HeapSort(int *arr)
if (arr == nullptr || arr.length < 2) {
return;
}
//最后一个叶子结点开始调整成大根堆
for (int i = arr.length - 1; i >= 0; i--) {
heapify(arr, i, arr.length);
}
int heapSize = arr.length;
//根和作业后一个叶子结点交换,并且堆的大小减1
swap(arr, 0, --heapSize);
while (heapSize > 0) { // O(N)
heapify(arr, 0, heapSize); // O(logN)
swap(arr, 0, --heapSize); // O(1)
}
}