堆排序实际上是把数组当成一个完全二叉树来处理。堆排序的目的是构建根永远大于等于其所有子节点的树,当然这个例子里没有树,只是数组按照完全二叉树的结构模拟的树。堆排序的一部分可以用来实现找数组中的最大元素(sort函数内只用第一个for循环),两个for循环都用的话就是排序了,而且这个排序能实现只要最小或最大的几个而不是全部都排好。
完全二叉树定义:
只有最后一行或倒数第二行才有叶结点,并且最后一行的叶结点都在最左边。
从右到左,从下往上找非叶节点,每找到一个就调整堆结构(调用adjustHeap函数),这个过程是这样的:
它有三个参数,第一个arr表示整个数组,第二个参数i表示从哪个节点开始调整,第三个参数表示边界,这个边界之外的是不调整位置的。
这个函数的核心就是当子节点比父节点大时交换两者的位置。
int temp = arr[i];//先取出当前元素i
for(int k=i*2+1;k<length;k=k*2+1){//因为可能换下去的数字比下面的小,所以还要继续往下检测,直到越界
if(k+1<length && arr[k]<arr[k+1]){//如果左子结点小于右子结点,k指向右子结点
k++;
}
if(arr[k] >temp){//如果子节点大于父节点
arr[i] = arr[k];//把子节点值赋给父节点,但子节点的值暂时不给,因为如果for循环继续的话,给了也会被覆盖,是多余的。而如果不继续循环到最后再给值也一样。
i = k;//向下到左子节点
}else{
break;//如果父节点大,那没必要遍历了,因为是从下往上每个节点都执行这个函数,所以只要不是换下来的导致是不会出现子节点大的。
}
}
arr[i] = temp;//将temp值放到最终的位置
这里有一个游标k表示当前节点位置,起始值为根节点的左子节点,i表示其父节点位置,起始值为根节点,for循环不断让k=2*k+1这样就能让其不断往其左子节点走。i是怎么当父节点的呢?开始时i是根节点,而k是根的左子结点,一开始就是父节点,而每次出现父节点比子节点小,就让父节点(i)的位置变成当前位置(k)的值,然后i变成当前节点的索引k。之后k继续往下时,i仍是其父节点。
这里面还有一点,k不一定是左子节点,当右子节点k+1对应的值比k对应的大时,且k+1没有越界,则k++,即k会指向i的右子结点。
而如果父节点大,如注释,直接break即可。
在for循环之前先取出arr[i]即根节点的值,我们要给这个值安排位置,因为for循环中,每交换一次位置这个值的位置都会改变,所以我们可以最后给它位置。
整个上面的过程(即sort里的第一个for循环)实现了所有根节点都大于其所有子节点,这时最大值就在根那里了(即arr[0])。
然后再看第二个for循环,举例来讲,第一次根为最大值10,那么就把10和最后一个数交换位置,然后调整堆,让根重新为最大值9,然后把根和倒数第二个数交换位置,这样最后两个就是数组中最大的两个,依次不断循环就能把整个数组安排好。不用担心10和9这些排好位置的数的位置会改变,因为每次右边界都减1,他们永远是在边界之外的,调整位置不会涉及他们。
package sortdemo;
import java.util.Arrays;
/**
* Created by chengxiao on 2016/12/17.
* 堆排序demo
*/
public class HeapSort {
public static void main(String []args){
int []arr = {9,8,7,6,5,4,3,2,1};
sort(arr);
System.out.println(Arrays.toString(arr));
}
public static void sort(int []arr){
//1.构建大顶堆
for(int i=arr.length/2-1;i>=0;i--){
//从第一个非叶子结点从下至上,从右至左调整结构
adjustHeap(arr,i,arr.length);
}
//2.调整堆结构+交换堆顶元素与末尾元素
for(int j=arr.length-1;j>0;j--){
swap(arr,0,j);//将堆顶元素与末尾元素进行交换
adjustHeap(arr,0,j);//重新对堆进行调整,只进行部分重排,因为其他地方都没有问题,只有当上面的换下来才可能导致不是大根。
}
}
/**
* 调整大顶堆(仅是调整过程,建立在大顶堆已构建的基础上)
* @param arr
* @param i
* @param length
*/
public static void adjustHeap(int []arr,int i,int length){
int temp = arr[i];//先取出当前元素i
for(int k=i*2+1;k<length;k=k*2+1){//因为可能换下去的数字比下面的小,所以还要继续往下检测,直到越界
if(k+1<length && arr[k]<arr[k+1]){//如果左子结点小于右子结点,k指向右子结点
k++;
}
if(arr[k] >temp){//如果子节点大于父节点
arr[i] = arr[k];//把子节点值赋给父节点,但子节点的值暂时不给,因为如果for循环继续的话,给了也会被覆盖,是多余的。而如果不继续循环到最后再给值也一样。
i = k;//向下到左子节点
}else{
break;//如果父节点大,那没必要遍历了,因为是从下往上每个节点都执行这个函数,所以只要不是换下来的导致是不会出现子节点大的。
}
}
arr[i] = temp;//将temp值放到最终的位置
}
/**
* 交换元素
* @param arr
* @param a
* @param b
*/
public static void swap(int []arr,int a ,int b){
int temp=arr[a];
arr[a] = arr[b];
arr[b] = temp;
}
}
文章最开始我说过堆排序可以只排最小的k个数,因为第二个for循环里每次都是把最小的换到末尾,那只换k次就可以了。
这个在剑指offer里是有题目的,代码只需要改一下sort函数就可以了
public ArrayList<Integer> GetLeastNumbers_Solution(int [] input, int k) {
ArrayList<Integer> arr = new ArrayList();
if(k > input.length){
return arr;
}
//1.构建大顶堆
int length = input.length;
for(int i = length/2-1;i>=0;i--){
//从第一个非叶子结点从下至上,从右至左调整结构
adjustHeap(input,i,length);
}
//2.调整堆结构+交换堆顶元素与末尾元素
for(int j = length - 1; j > input.length - k -1; j--){
swap(input,0,j);//将堆顶元素与末尾元素进行交换
adjustHeap(input,0,j);
arr.add(input[j]);//换到末尾后就立即加入arr即可
}
return arr;
}