堆
堆排序是简单选择排序的一种改进。下面先说一下什么是堆,再来说堆排序。
1.堆:具有n个数据元素的序列{
k(1)
,
k(2)
,
k(3)
,…,
k(n)
},当且仅当满足
a.
k(i)
>=
k(2i)
且
k(i)
>=
k(2i+1)
或
b.
k(i)
<=
k(2i)
且
k(i)
<=
k(2i+1)
c. i=1,2,3,…,n/2
满足条件a的堆称为大顶堆,满足b的堆称为小顶堆。
2.如果将堆序列中的元素存放在一棵完全二叉树中,数据从上到下,从左到右地按层存放,那么对可以与一棵二叉树相对应。进而将数组向后错开一位则与树中标号相同。
3.完全二叉树:叶子结点只能出现在最下层和次最下层,且最下层的叶子结点集中在树的左部。不要因为完全二字就和满二叉树弄混。
(下面是基于大顶堆的算法)
堆排序
核心思想:
1.将原始序列构建成一个堆,即建立初始堆。
2.交换堆的第一个元素和堆的最后一个位置。
3.将移走最大值元素后的剩余元素所构成的序列再转换成一个堆
4.重复2,3步n-1次
经过上述操作,就可将一个无序序列从小到大进行排序,该方法称为堆排序方法。
核心问题:
1.将移走最大值元素之后剩余元素构成的序列转换为一个堆:(移走最大值是在堆的基础上)
(1)交换堆的第一个元素和堆的最后一个位置。
(2)采用自上而下的调整,所谓调整,就是将序号为i的结点与其左右孩子(2i和2i+1)这三个中的最大值替换到序号为i的结点位置上。
(3)彻底完成一次从上到下的调整,会得到一个堆。
算法描述如下:
//函数作用:将以第i个元素作为根结点的子树调整为一个新的堆序列
void adjust(keytype k[],int i,int n) //参数i为序列k(即在树中的序号)中的一个元素下标
{
int j;
keytype tmp;
tmp=k[i];
j=2*i; //j为i的左孩子结点序号
while(j<=n)
{
if(j<n&&k[j]<k[j+1])
{
j++; //j为i的左右孩子中较大孩子的序号
}
if(tmp>=k[j])
{
break; //无需再调整
}
k[j/2]=k[j]; //子结点与父结点交换位置
j=j*2; //继续向下调整
}
k[j/2]=tmp;
}
2.将原始序列构成一个堆:
(1)设原序列对应的完全二叉树有n个结点,初始时,令序列号i=[n/2],对应二叉树中第[n/2]个结点(二叉树中结点按层次编号)
(2)调用函数adjust()进行调整。
(3)每执行完一次调整都执行一次i=i-1的操作。
(4)重复(2)(3),直到i=1。即在自下到上中包含着自上到下。
(5)最后再调用adjust()函数调整。
堆排序算法如下:
void heapsort(keytype k[],int n)
{
int i;
keytype tmp;
for(i=n/2;i>=1;i--)
{
adjust(k,i,n); //将原始序列初始化为一个堆
}
for(i=n-1;i>=1;i--)
{ /*交换第一个和第n个元素,再将跟结点向下调整, 此时除了根结点外,其余的任何一棵子树都是满足堆得特性的*/
tmp=k[i+1];
k[i+1]=k[1]; //交换第一个和第n个元素
k[1]=tmp;
adjust(k,1,i); //将跟结点向下调整
}
}
上述代码描述了堆排序的过程,注意的是,待排序序列存放在数组k中,数组k的下标从1有效也就是k[0]的内容不参与排序。
理解堆排序应把握以下几点:
(1)堆排序是针对线性序列的排序,之所以要采用完全二叉树的形式解释堆排序的过程,是出于方便解释的需求。
(2)如果基于大顶堆进行堆排序,排序后序列从小到大排列;如果基于小顶堆,则为从大到小排序。
例:编写一段C语言程序,实现将数据序列{5,2,12,6,9,0,3,6,15,20}从大到小排序,要求用堆排序实现。
#include"stdio.h"
typedef int keytype;
void adjust(keytype k[],int i,int n)
{
int j;
keytype tmp;
tmp=k[i];
j=i*2;
while(j<=n)
{
if(j<n&&k[j]>k[j+1])
{
j++;
}
if(tmp<k[j])
{
break;
}
k[j/2]=k[j];
j=j*2;
}
k[j/2]=tmp;
}
void heapsort(keytype k[],int n)
{
int i;
keytype tmp;
for(i=n/2;i>=1;i--)
{
adjust(k,i,n); //将原始序列初始化成一个小顶堆
}
for(i=n-1;i>=1;i--)
{
tmp=k[i+1];
k[i+1]=k[1];
k[1]=tmp;
adjust(k,1,i);
}
main()
{
int i, k[11]={-111,5,2,12,6,9,0,3,6,15,20};
printf("The orginal data array is:\n");
for(i=1;i<11;i++)
printf("%d",k[i]);
heapsort(k,10) //10表示的是最后一个元素下标,即个数
printf("\nThe result of heap sorting for the array is:\n");
for(i=1;i<11;i++)
printf("%d",k[i]);
getche();
}
//初始化序列时,数组的第一个元素可放任意数据,它不参与排序。