首先,堆是完全二叉树(指每一层的节点都是从左到右填)
而二叉树可以用数组来表示,如上述二叉树从上到下,从左到右编号并放入数组:int arr[]={1, 2, 3, 4, 5, 6};
有公式:
父节点的下标 parent = ( i - 1 ) / 2;(向下取整)
左子节点下标 c1 = 2 i + 1;
右子节点下标 c2 = 2 i + 2;
//堆排序(利用数组作为堆)
//tree是待排序数组,n是长度,i是当前根序号
void swap(int tree[], int i, int j) {
int temp = tree[i];
tree[i] = tree[j];
tree[j] = temp;
}
void heapify(int tree[], int n, int i) {
if (i >= n) {
return;
}
int c1 = 2 * i + 1;
int c2 = 2 * i + 2;
int max = i;
if (c1<n && tree[c1]>tree[max]) {
max = c1;
}
if (c2<n && tree[c2]>tree[max]) {
max = c2;
}
if (max != i) {
swap(tree, max, i);
heapify(tree, n, max);
}
}
void build_heap(int tree[], int n) {
int last_node = n - 1;
int last_parent = (last_node - 1) / 2;
for (int i = last_parent; i >= 0; i--) {
heapify(tree, n, i);
}
}
void heap_sort(int tree[], int n) {
//建堆
build_heap(tree, n);
for (int i = n - 1; i >= 0; i--) {
swap(tree, i, 0);
heapify(tree, i, 0);
}
}
看到这么多代码先不要慌,一步步分解;
首先看heapify这个函数,它是负责调整一个根及其左右子树,使其符合根大于左子树和右子树的值(也就是符合堆的定义)
而heapify最后的递归的存在意义是:调整被破坏的子树的结构,因为max和i交换后,以max为根的子树的堆结构可能被破坏。
注意,如果只使用heapify对根节点进行递归,会存在子孙节点比根节点大的情况。
再来看build_heap函数,它负责建立一个堆,last_node是最后一个节点,而last_parent是最后一个节点的父节点。
通过从last_parent节点向第一个节点不断进行heapify,可以保证建立一个堆结构。并且子孙节点都小于根节点。
heap_sort函数是真正开始堆排序,就是先建堆,此时可以保证最大节点就是堆顶的节点。
再把堆中最后一个节点和根节点交换,最大节点就到了最后,于是此时我们可以把最后一个节点放入有序的部分,体现在代码里就是用 i 作为堆的大小。
此时再对大小为 i 的堆进行调整,可以使第二大的元素进入堆顶,重复上述步骤即可完成堆排序。