堆排序的算法分析及程序示例

最新推荐文章于 2023-03-29 09:47:18 发布

chenzehe

最新推荐文章于 2023-03-29 09:47:18 发布

阅读量277

点赞数

分类专栏：数据结构文章标签：算法

本文链接：https://blog.csdn.net/chenguangyun123/article/details/83466150

版权

数据结构专栏收录该内容

6 篇文章 0 订阅

订阅专栏

[b]实例说明 [/b]
　　用堆排序的方法对数组进行排序。

[b]实例解析 [/b]

[b]堆排序 [/b]

　　堆排序定义： n 个关键字序列 K1，K2，……，Kn 称为堆，当且仅当该序列满足如下性质（简称为堆性质）： ① Ki≤Ｋ2i 且 Ki≤Ｋ2i +1 或 ② Ki ≥Ｋ2i 且 Ki ≥Ｋ2i +1(1 ≤i≤ n)。

　　若将此序列所存储的向量 R[1..n] 看做是一棵完全二叉树的存储结构，则堆实质上是满足如下性质的完全二叉树：树中任一非叶结点的关键字均不大于（或不小于）其左右子结点（若存在）的关键字。

　　例如，关键字序列（ 10，15，56，25，30，70 ）和 (70，56，30，25，15，10) 分别满足堆性质 ① 和 ②，故它们均是堆。

大根堆和小根堆

　　根结点（亦称为堆顶）的关键字是堆里所有结点关键字中最小者的堆称为小根堆。

　　根结点（亦称为堆顶）的关键字是堆里所有结点关键字中最大者的堆称为大根堆。

　　注意：堆中任一子树亦是堆；以上讨论的堆实际上是二叉堆（ Binary Heap ），类似地可定义Ｋ叉堆。

堆排序特点

　　堆排序（ HeapSort ）是一树形选择排序。在排序过程中，将 R[1..n] 看成是一棵完全二叉树的顺序存储结构，利用完全二叉树中双亲结点和孩子结点之间的内在关系，在当前无序区中选择关键字最大（或最小）的记录。

堆排序与直接插入排序的区别

　　直接选择排序中，为了从 R[1..n] 中选出关键字最小的记录，必须进行 n-1 次比较，然后在 R[2..n] 中选出关键字最小的记录，又需要做 n-2 次比较。事实上，后面的 n-2 次比较中，有许多比较可能在前面的 n-1 次比较中已经做过，但由于前一趟排序时未保留这些比较结果，所以后一趟排序时又重复执行了这些比较操作。

　　堆排序可通过树形结构保存部分比较结果，可减少比较次数。

　　堆排序利用了大根堆（或小根堆）堆顶记录的关键字最大（或最小）这特征，使得在当前无序区中选取最大（或最小）关键字的记录变得简单。

用大根堆排序的基本思想

　　① 先将初始文件 R[1..n] 建成一个大根堆，此堆为初始的无序区。

　　② 再将关键字最大的记录 R[1]( 即堆顶 ) 和无序区的最后一个记录 R[n] 交换，由此得到新的无序区 R[1..n-1] 和有序区 R[n], 且满足 R[1..n-1].keys ≤ R[n].key。

　　③ 由于交换后新的根 R[1] 可能违反堆性质，故应将当前无序区 R[1..n-1] 调整为堆。然后再次将 R[1..n-1] 中关键字最大的记录 R[1] 和该区间的最后一个记录 R[n-1] 交换，由此得到新的无序区 R[1..n-2] 和有序区 R[n-1..n], 且仍满足关系 R[1..n-2].keys ≤ R[n-1..n].keys, 同样要将 R[1..n-2] 调整为堆 …… 直到无序区只有一个元素为止。

大根堆排序算法的基本操作

　　① 初始化操作：将 R[1..n] 构造为初始堆。

　　② 每一趟排序的基本操作：将当前无序区的堆顶记录 R[1] 和该区间的最后一个记录交换，然后将新的无序区调整为堆（亦称重建堆）。

　　注意：只需做 n-1 趟排序，选出较大的 n-1 个关键字即可使得文件递增有序。用小根堆排序与利用大根堆类似，只不过其排序结果是递减有序的。堆排序和直接选择排序相反，在任何时间，堆排序中无序区总是在有序区之前，且有序区是在原向量的尾部由后往前逐步扩大至整个向量为止。

堆排序的算法如下：

void HeapSort(SeqList R){
// 对 R[1..n] 进行堆排序，用 R[0] 做暂存单元
int i;
BuildHeap(n); // 将 R[1..n] 建成初始堆
for(i=n;i>1;i--){ // 对当前无序区R[1..i]进行堆排序，共做n-1趟
R[0]=R[1];R[1]=R[i];R[i]=R[0]; //将堆顶和堆中最后一个记录交换
Heapify(R,1,i-1); // 将R[1..i-1]重新调整为堆,仅有R[1]可能违反堆性质
}//endfor
}//HeapSort

BuildHeap 和 Heapify 函数的实现：

　　因为构造初始堆必须使用到调整堆的操作，先讨论 Heapify 的实现。

　　Heapify 函数思想：每趟排序开始前 R[1..i] 是以 R[1] 为根的堆，在 R[1] 与 R[i] 交换后，新的无序区 R[1..i-1] 中只有 R[1] 的值发生了变化，故除 R[1] 可能违反堆性质外，其余任何结点为根的子树均是堆。因此，当被调整区间是 R[low..high] 时，只需调整以 R[low] 为根的树即可。

　　“筛选法”调整堆。 R[low] 的左、右子树（若存在）均已是堆，这两棵子树的根 R[2low] 和 R[2low+1] 分别是各自子树中关键字最大的结点。若 R[low].key 不小于这两个孩子结点的关键字，则 R[low] 未违反堆性质，以 R[low] 为根的树已是堆，无需调整；否则必须将 R[low] 和它的两个孩子结点中关键字较大者进行交换，即 R[low] 与 R[large](R[large].key=max(R[2low].key,R[2low+1].key)) 交换。交换后又可能使结点 R[large] 违反堆性质，同样由于该结点的两棵子树（若存在）仍然是堆，故可重复上述的调整过程，对以 R[large] 为根的树进行调整。此过程直至当前被调整的结点已满足堆性质，或者该结点已是叶子为止。上述过程就像过筛子一样，把较小的关键字逐层筛下去，而将较大关键字逐层选上来。因此，有人将此方法称为“筛选法”。

具体算法如下：

void Heapify(SeqList R,int s,int m){
// 对 R[1..n] 进行堆调整用 temp 做暂存单元
int j;
temp=R[s];
j=2*s;
while(j<=m){
if(R[j]>R[j+1] && j<m) j++;
if(temp<R[j]) break;
R[s]=R[j];
s=j;
j=j*2;
}//endwhile
R[s]=temp;
}//Heapify

　　BuildHeap 的实现：要将初始文件 R[1..n] 调整为一个大根堆，就必须将它所对应的完全二叉树中以每一结点为根的子树都调整为堆。

　　显然只有一个结点的树是堆，而在完全二叉树中，所有序号 i>[n>2] 的结点都是叶子，因此以这些结点为根的子树均已是堆。这样，只需依次将以序号为 [n/2],[n/2]-1,…,1 的结点作为根的子树都调整为堆即可。

具体算法如下：

void BuildHeap(SeqList R,int n){
for(int i=n/2;i>0;i--) Heapify(R,i,n);
}

程序代码—堆排序

#include <stdio.h>
#define MAX 255
int R[MAX];
void Heapify(int s,int m){ /* 对 R[1..n] 进行堆调整，用 temp 做暂存单元 */
int j,temp;
temp=R[s];
j=2*s;
while(j<=m){
if(R[j]>R[j+1] && j<m) j++;
if(temp<R[j]) break;
R[s]=R[j];
s=j;
j=j*2;
} /*end of while*/
R[s]=temp;
}/*end of Heapify*/

void BuildHeap(int n){ /* 由一个无序的序列建成一个堆 */
int i;
for(i=n/2;i>0;i--) Heapify(i,n);
}

void Heap_Sort(int n){ /* 对 R[1..n] 进行堆排序，用 R[0] 做暂存单元 */
int i;
BuildHeap(n); /* 将 R[1..n] 建成初始堆 */
for(i=n;i>1;i--){ /* 对当前无序区 R[1..i] 进行堆排序，共做 n-1 趟。 */
R[0]=R[1];R[1]=R[i];R[i]=R[0]; /* 将堆顶和堆中最后一个记录交换 */
Heapify(1,i-1); /* 将 R[1..i-1] 重新调整为堆，有 R[1] 可能违反堆性质 */
}/*end of for*/
}/*end of Heap_Sort*/

void main(){
int i,n;
clrscr();
puts("Please input total element number of the sequence:");
scanf("%d",&n);
if(n<=0 || n>MAX){
printf("n must more than 0 and less than %d.\n",MAX);
exit(0);
}
puts("Please input the elements one by one:");
for(i=1;i<=n;i++)
scanf("%d",&R[i]);
puts("The sequence you input is:");
for(i=1;i<=n;i++)
printf("%4d",R[i]);
Heap_Sort(n);
puts("\nThe sequence after Big heap_sort is:");
for(i=1;i<=n;i++)
printf("%4d",R[i]);
puts("\n Press any key to quit…");
getch();
}

归纳注释

　　堆排序的时间主要由建立初始堆和反复重建堆这两部分的时间开销构成，它们均是通过调用 Heapify 实现的。

　　堆排序的最坏时间复杂度为 O(n×lgn) 。堆排序的平均性能较接近于最坏性能。

　　由于建初始堆所需的比较次数较多，所以堆排序不适于记录数较少的文件。

　　堆排序是就地排序，辅助空间为 O(1), 堆排序是不稳定的排序方法。