堆排序算法介绍
堆是一种重要的数据结构,为一棵完全二叉树, 底层如果用数组存储数据的话,假设某个元素为序号为i(Java数组从0开始,i为0到n-1), 如果它有左子树,那么左子树的位置是2i+1,如果有右子树,右子树的位置是2i+2,如果有父节点,父节点的位置是(n-1)/2取整。分为最大堆和最小堆,最大堆的任意子树根节点不小于任意子结点,最小堆的根节点不大于任意子结点。所谓堆排序就是利用堆这种数据结构来对数组排序,我们使用的是最大堆。处理的思想和冒泡排序,选择排序非常的类似,一层层封顶,只是最大元素的选取使用了最大堆。最大堆的最大元素一定在第0位置,构建好堆之后,交换0位置元素与顶即可。堆排序为原位排序(空间小), 且最坏运行时间是O(n2),是渐进最优的比较排序算法。
堆排序算法Java实现
堆排序的大概步骤如下:
- 构建最大堆。
- 选择顶,并与第0位置元素交换
- 由于步骤2的的交换可能破环了最大堆的性质,第0不再是最大元素,需要调用maxHeap调整堆(沉降法),如果需要重复步骤2
堆排序中最重要的算法就是maxHeap,该函数假设一个元素的两个子节点都满足最大堆的性质(左右子树都是最大堆),只有跟元素可能违反最大堆性质,那么把该元素以及左右子节点的最大元素找出来,如果该元素已经最大,那么整棵树都是最大堆,程序退出,否则交换跟元素与最大元素的位置,继续调用maxHeap原最大元素所在的子树。该算法是分治法的典型应用。具体代码如下:
public class Test1 {
public static void main(String[] args) {
int[] array = { 23, 5, 64, 12, 9 };
printArray(array);
heapSort(array);
printArray(array);
}
public static void heapSort(int[] array) {
if (array == null || array.length <= 1) {
return;
}
buildMaxHeap(array);
for (int i = array.length - 1; i >= 1; i--) {
swap(array, 0, i);
maxHeap(array, i, 0);
}
}
private static void buildMaxHeap(int[] array) {
if (array == null || array.length <= 1) {
return;
}
int half = array.length / 2;
for (int i = half; i >= 0; i--) {
maxHeap(array, array.length, i);
}
}
// index为非叶子节点对应数组的下标值
private static void maxHeap(int[] array, int heapSize, int index) {
int left = index * 2 + 1; // left为子树对应的数组下标
int right = index * 2 + 2; // right为右子树对应的数组下标
int largest = index;
if (left < heapSize && array[left] > array[index]) {
largest = left;
}
if (right < heapSize && array[right] > array[largest]) {
largest = right;
}
if (index != largest) {
swap(array, index, largest);
maxHeap(array, heapSize, largest);
}
}
public static void printArray(int[] array) {
for (int i = 0; i < array.length; i++) {
System.out.print(array[i] + " ");
}
System.out.println();
}
public static void swap(int[] array, int a, int b) {
int temp = array[a];
array[a] = array[b];
array[b] = temp;
}
}
http://blog.csdn.net/kimylrong/article/details/17150475
总结:(1)这个代码别人写的,写的确实很精练。虽然不多,涉及到完全二叉树的概念,递归。
(2)理解buildMaxHeap()中int half = array.length / 2;其实是为了,完全二叉树的非叶子节点序号开始。
(3)if (right < heapSize && array[right] > array[largest]) {
largest = right;
}
这里在调试的时候,发现right超过了数组的长度了,但是这里的写法就屏蔽执行array[right] > array[largest]了。
这个技巧要注意。
//---------------------------------
1、第一次执行maxHeap(),index = 2,如下图:
2、第二次执行maxHeap(),index = 1,如下图: