堆排序

在程序设计相关领域,堆(Heap)的概念主要涉及到两个方面:

  • 一种数据结构,逻辑上是一颗完全二叉树,存储上是一个数组对象(二叉堆)。
  • 垃圾收集存储区,是软件系统可以编程的内存区域。

本文所说的堆,指的是前者。

堆排序的时间复杂度是O(nlgN),与快速排序达到相同的时间复杂度。但是在实际应用中,我们往往采用快速排序而不是堆排序。这是因为快速排序的一个好的实现,往往比堆排序具有更好的表现。堆排序的主要用途,是在形成和处理优先级队列方面。另外,如果计算要求是类优先级队列(比如,只要返回最大或者最小元素,只有有限的插入要求等),堆同样是很适合的数据结构。

堆排序(Heap Sort)就是利用堆(假设利用大顶堆)进行排序的方法。它的基本思想是,将待排序的序列构造成一个大顶堆。此时,整个序列的最大值就是堆顶的根结点。将它移走(其实就是将其与堆数组的末尾元素交换,此时末尾元素就是最大值),然后将剩余的n-1个序列重新构造成一个堆,这样就会得到n个元素中的次小值。如此反,便能得到一个有序序列了复执行。

例如图9‐7‐4所示,左图是一个大顶堆,90为最大值,将90与20(末尾元素)互换,如中图所示,此时90就成了整个堆序列的最后一个元素,将20经过调整,使得除90以外的结点继续满足大顶堆定义(所有结点都大于等于其子孩子),见右图,然后再考虑将30与80互换……

 
 
图9-7-4

相信大家有些明白堆排序的基本思想了,不过要实现它还需要解决两个问题:

1.如何由一个无序序列构建成一个堆?

2.如果在输出堆顶元素后,调整剩余元素成为一个新的堆?

要解释清楚它们,让我们来看代码。

 
 
  1. /* 对顺序表L进行堆排序 */  
  2. 1 void HeapSort(SqList *L)  
  3. 2 {  
  4. 3 int i;  
  5. 4 for(i=L->length/2;i>0;i--) /* 把L中的r构建成一个大顶堆 */  
  6. 5 HeapAdjust(L,i,L->length);  
  7. 6 for(i=L->length;i>1;i--)  
  8. 7 {  
  9. 8 swap(L,1,i); /*将堆顶记录和当前未经排序子序列的最后一个记录交换*/  
  10. 9 HeapAdjust(L,1,i-1); /* 将L->r[1..i-1]重新调整为大顶堆 */  
  11. 10 }  
  12. 11 } 

从代码中也可以看出,整个排序过程分为两个for循环。第一个循环要完成的就是将现在的待排序序列构建成一个大顶堆。第二个循环要完成的就是逐步将每个最大值的根结点与末尾元素交换,并且再调整其成为大顶堆。

假设我们要排序的序列是{50,10,90,30,70,40,80,60,20}5,那么L.length=9,第一个for循环,代码第4行,i是从.9/2.=4开始,4321→→→的变量变化。为什么不是从1到9或者从9到1,而是从4到1呢?其实我们看了图9‐7‐5就明白了,它们都有什么规律?它们都是有孩子的结点。注意灰色结点的下标编号就是1、2、3、4。

注:5 这里把每个数字乘以10,是为了与下标的个位数字进行区分,因为我们在讲解中,会大量的提到数组下标的数字。

 
图9-7-5

我们所谓的将待排序的序列构建成为一个大顶堆,其实就是从下往上、从右到左,将每个非终端结点(非叶结点)当作根结点,将其和其子树调整成大顶堆。i的4→3→2→1的变量变化,其实也就是30,90,10、50的结点调整过程。

既然已经弄清楚i的变化是在调整哪些元素了,现在我们来看关键的HeapAdjust(堆调整)函数是如何实现的。

 
 
  1. /* 已知L->r[s..m]中记录的关键字除L->r[s]之外均满足堆的定义 */  
  2. /* 本函数调整L->r[s]的关键字,使L->r[s..m]成为一个大顶堆 */  
  3. 1 void HeapAdjust(SqList *L,int s,int m)  
  4. 2 {  
  5. 3 int temp,j;  
  6. temp=L->r[s];  
  7. 5 for(j=2*s;j<=m;j*=2) /* 沿关键字较大的孩子结点向下筛选 */  
  8. 6 {  
  9. 7 if(j<m && L->r[j]<L->r[j+1])  
  10. 8 ++j; /* j为关键字中较大的记录的下标 */  
  11. 9 if(temp>=L->r[j])  
  12. 10 break; /* rc应插入在位置s上 */  
  13. 11 L->r[s]=L->r[j];  
  14. 12 s=j;  
  15. 13 }  
  16. 14 L->r[s]=temp; /* 插入 */  
  17. 15 } 

1.函数被第一次调用时,s=4,m=9,传入的SqList参数的值为lenth=9,r[10,70,40,20}。

2.第4行,将L.r[s]=L.r[4]=30赋值给temp,如图9‐7‐6所示。

 
图9-7-6

3.第5~13行,循环遍历其结点的孩子。这里j变量为什么是从2*s开始呢?又为什么是j*=2递增呢?原因还是二叉树的性质5,因为我们这棵是完全二叉树,当前结点序号是s,其左孩子的序号一定是2s,右孩子的序号一定是2s+1,们的孩子以的位数序号增加,因此j变量才是这样循环。

4.第7~8行,此时j=2*4=8,j<m说明它不是最后一个结点,如果L.r[j]<L.r[j+1],则说明左孩子小于右孩子。我们的目的是要找到较大值,当然需要让j+1以便变成指向右孩子的下标。当前30的左右孩子是60和20,并不满足此条件,因此j还8。

5.第9~10行,temp=30,L.r[j]=60,并不满足条件。

6.第11~12行,将60赋值给L.r[4],并令s=j=8。也就是说,当前算出,以30为根结点的子二叉树,当前最大值是60,在第8的位置。注意此时L.r[4]和L.r[8]的值均为60。

7.再循环因为j=2*j=16,m=9,j>m,因此跳出循环。

8.第14行,将temp=30赋值给L.r[s]=L.r[8],完成30与60的交换工作。如图9‐7‐7所示。本次函数调用完成。

 
图9-7-7

9.再次调用HeapAdjust,此时s=3,m=9。第4行,temp=L.r[3]=90,第7~8行,由于40<80得到j+1=2*s+1=7。9~10行,由于90>80,因此退出循环,最终本次调用,整个序列未发什么改变。

10.再次调用HeapAdjust,此时s=2,m=9。第4行,temp=L.r[2]=10,第7~8行,60<70,使得j=5。最终本次调用使得10与70进行了互换。

 
 
图9-7-8
11.再次调用HeapAdjust,此时s=1,m=9。第4行,temp=L.r[1]=50,第7~8行,70<90,使得j=3。第11~12行,L.r[1]被赋值了90,并且s=3,再循环,由于2j=6并未大于m,因此再次执行循环体,使得L.r[3]被赋值了80,完成循环后,L.[7]被赋值为50,最终本次调用使得50、90、80进行了轮换。
 
图9-7-9

到此为止,我们构建大顶堆的过程算是完成了,也就是HeapSort函数的第4~5行循环执行完毕。或许是有点复杂,如果不明白,多试着模拟计算机执行的方式走几遍,应该就可以理解其原理。

接下来HeapSort函数的第6~11行就是正式的排序过程,由于有了前面的充分准备,其实这个排序就比较轻松了。下面是这部分代码。

 
 
  1. 6 for(i=L->length;i>1;i--)  
  2. 7 {  
  3. 8 swap(L,1,i); /* 将堆顶记录和当前未经排序子序列的最后一个记录交换 */  
  4. 9 HeapAdjust(L,1,i-1); /* 将L->r[1..i-1]重新调整为大顶堆 */  
  5. 10 } 

1.当i=9时,第8行,交换20与90,第9行,将当前的根结点20进行大顶堆的调整,调整过程和刚才流程一样,找到它左右子结点的较大值,互换,再找到其子结点的较大值互换。此时序列变为{80,70,50,60,10,40,20,30,90},如图9‐7‐10所示。

 
(点击查看大图)图9-7-10
2.当i=8时,交换30与80,并将30与70交换,再与60交换,此时序列变为{70,60,50,30,10,40,20,80,90},如图9‐7‐11所示。
 
(点击查看大图)图9-7-11
3.后面的变化完全类似,不解释,只看图。
 
(点击查看大图)图9-7-12
最终就得到一个完全有序的序列了。


  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值