第八章 排序技术
【学习重点】
(1)各种排序算法的基本思想;
(2)各种排序算法的执行过程;
(3)各种排序算法的设计;
(4)各种排序算法时间复杂度的分析;
(5)各种排序算法之间的比较。
【学习难点】
(1)快速排序、堆排序、归并排序、基数排序等算法;
(2)快速排序算法的时间复杂度分析。
8.1 概 述
8.1.1 排序的基本概念
排序算法的稳定性:假定在待排序的记录集中,存在多个具有相同键值的记录,若经过排序,这些记录的相对次序仍然保持不变,即在原序列中,ki=kj且ri在rj之前,而在排序后的序列中,ri仍在rj之前,则称这种排序算法是稳定的;否则称为不稳定的。
单键排序:根据一个关键码进行的排序;
多键排序:根据多个关键码进行的排序。
设关键码分别为k1, k2, …,km,多键排序有两种方法:
⑴依次对记录进行m次排序,第一次按k1排序,第二次按k2排序,依此类推。这种方法要求各趟排序所用的算法是稳定的;
⑵将关键码k1, k2, …,km分别视为字符串依次首尾连接在一起,形成一个新的字符串,然后,对记录序列按新形成的字符串排序。
排序的分类
1.内排序:在排序的整个过程中,待排序的所有记录全部被放置在内存中
2.外排序:由于待排序的记录个数太多,不能同时放置在内存,而需要将一部分记录放置在内存,另一部分记录放置在外存上,整个排序过程需要在内外存之间多次交换数据才能得到排序的结果。
排序的分类
1.基于比较:基本操作——关键码的比较和记录的移动,其最差时间下限已经被证明为Ω(nlog2n)。
(1)插入排序
(2)交换排序
(3)选择排序
(4)归并排序
2.不基于比较:根据关键码的分布特征。
排序算法的性能
1. 基本操作。内排序在排序过程中的基本操作:
⑴比较:关键码之间的比较;
⑵移动:记录从一个位置移动到另一个位置。
2. 辅助存储空间。
辅助存储空间是指在数据规模一定的条件下,除了存放待排序记录占用的存储空间之外,执行算法所需要的其他存储空间。
3. 算法本身的复杂程度。
8.2 插入排序8.2.1 直接插入排序
插入排序的主要操作是插入,其基本思想是:每次将一个待排序的记录按其关键码的大小插入到一个已经排好序的有序序列中,直到全部记录排好序为止。
解决方法:
将第1个记录看成是初始有序表,然后从第2个记录起依次插入到这个有序表中,直到将第n个记录插入。
算法描述:
for (i=2; i<=n; i++)
{
插入第i个记录,即第i趟直接插入排序;
}
解决方法:
在i-1个记录的有序区r[1] ~ r[i-1]中插入记录r[i],首先顺序查找r[i]的正确插入位置,然后将r[i]插入到相应位置。
算法描述:
r[0]=r[i]; j=i-1;
while (r[0]<r[j])
{
r[j+1]=r[j];
j--;
}
r[0]有两个作用:
1. 进入循环之前暂存了r[i]的值,使得不致于因记录的后移而丢失r[i]的内容;
2. 在查找插入位置的循环中充当哨兵。
直接插入排序算法:
void insertSort (int r[ ], intn)
{
for (i=2; i<=n; i++)
{
r[0]=r[i]; j=i-1;
while (r[0]<r[j])
{
r[j+1]=r[j];
j=j-1;
}
r[j+1]=r[0];
}
}
直接插入算法的性能分析:
空间性能:需要一个记录的辅助空间。
直接插入排序算法是一种稳定的排序算法。
改进的着眼点:
(1)若待排序记录按关键码基本有序时,直接插入排序的效率可以大大提高;
(2)由于直接插入排序算法简单,则在待排序记录数量n较小时效率也很高。
基本思想:将整个待排序记录分割成若干个子序列,在子序列内分别进行直接插入排序,待整个序列中的记录基本有序时,对全体记录进行直接插入排序。
基本有序:接近正序,例如{1, 2, 8, 4, 5, 6, 7, 3, 9};
局部有序:部分有序,例如{6, 7, 8, 9, 1, 2, 3, 4, 5}。
局部有序不能提高直接插入排序算法的时间性能。
希尔排序算法的时间性能:
希尔排序开始时增量较大,每个子序列中的记录个数较少,从而排序速度较快;当增量较小时,虽然每个子序列中记录个数较多,但整个序列已基本有序,排序速度也较快——缩小增量。
希尔排序算法的时间性能是所取增量的函数,而到目前为止尚未有人求得一种最好的增量序列。
研究表明,希尔排序的时间性能在O(n2)和O(nlog2n)之间。当n在某个特定范围内,希尔排序所需的比较次数和记录的移动次数约为O(n1.3) 。
8.3 交换排序
交换排序的主要操作是交换,其主要思想是:在待排序列中选两个记录,将它们的关键码相比较,如果反序(即排列顺序与排序后的次序正好相反),则交换它们的存储位置。
8.3.1 起泡排序
基本思想:两两比较相邻记录的关键码,如果反序则交换,直到没有反序的记录为止。
待解决的问题:
⑴ 在一趟起泡排序中,若有多个记录位于最终位置,应如何记载?
⑵如何确定起泡排序的范围,使得已经位于最终位置的记录不参与下一趟排序?
⑶ 如何判别起泡排序的结束?
(1)解决方法:
设变量exchange记载记录交换的位置,则一趟排序后,exchange记载的一定是这一趟排序中记录的最后一次交换的位置,且从此位置以后的所有记录均已经有序。
算法描述:
if (r[j]>r[j+1]){
r[j]←→r[j+1];
exchange=j;
}
(2)解决方法:
设bound位置的记录是无序区的最后一个记录,则每趟起泡排序的范围是r[1] ~ r[bound]。
在一趟排序后,从exchange位置之后的记录一定是有序的,所以bound=exchange。
算法描述:
bound=exchange;
for (j=1; j<bound; j++)
if (r[j]>r[j+1]){
r[j]<==>r[j+1];
exchange=j;
}
(3)解决方法:
在每一趟起泡排序之前,令exchange的初值为0,在以后的排序过程中,只要有记录交换,exchange的值就会大于0。这样,在一趟比较完毕,就可以通过exchange的值是否为0来判别是否有记录交换,从而判别整个起泡排序的结束。
算法描述:
while (exchange)
{
执行一趟起泡排序;
}
起泡排序算法:
void BubbleSort(intr[ ], intn)
{
exchange=n;
while (exchange)
{
bound=exchange;
exchange=0;
for (j=1;j<bound; j++)
if (r[j]>r[j+1]) {
r[j]←→r[j+1];
exchange=j;
}
}
}
8.3.2 快速排序基本思想:
首先选一个轴值(即比较的基准),通过一趟排序将待排序记录分割成独立的两部分,前一部分记录的关键码均小于或等于轴值,后一部分记录的关键码均大于或等于轴值,然后分别对这两部分重复上述方法,直到整个序列有序。
(1)如何选择轴值?
选择轴值的方法:
1.使用第一个记录的关键码;
2.选取序列中间记录的关键码;
3.比较序列中第一个记录、最后一个记录和中间记录的关键码,取关键码居中的作为轴值并调换到第一个记录的位置;
4.随机选取轴值。
(2)如何实现一次划分?
解决方法:
设待划分的序列是r[s] ~ r[t],设参数i,j分别指向子序列左、右两端的下标s和t,令r[s]为轴值,
(1)j从后向前扫描,直到r[j]<r[i],将r[j]移动到r[i]的位置,使关键码小(同轴值相比)的记录移动到前面去;
(2)i从前向后扫描,直到r[i]>r[j],将r[i]移动到r[j]的位置,使关键码大(同轴值比较)的记录移动到后面去;
(3)重复上述过程,直到i=j。
算法:
intPartition(intr[ ], intfirst, intend)
{
i=first; j=end; //初始化
while (i<j)
{
while (i<j && r[i]<= r[j])j--; //右侧扫描
if(i<j) {
r[i]←→r[j]; i++; //将较小记录交换到前面
}
while (i<j && r[i]<= r[j])i++; //左侧扫描
if (i<j) {
r[j]←→r[i]; j--; //将较大记录交换到后面
}
}
retutn i; //i为轴值记录的最终位置
}
8.4 选择排序
8.4.1 简单选择排序
选择排序的主要操作是选择,其主要思想是:每趟排序在当前待排序序列中选出关键码最小的记录,添加到有序序列中。
简单排序算法:
void selectSort ( int r[ ], intn)
{
for ( i=1; i<n; i++)
{
index=i;
for (j=i+1; j<=n; j++)
if (r[j]<r[index]) index=j;
if (index!=i) r[i] ←→r[index];
}
}
8.4.2 堆排序
改进的着眼点:如何减少关键码间的比较次数。若能利用每趟比较后的结果,也就是在找出键值最小记录的同时,也找出键值较小的记录,则可减少后面的选择中所用的比较次数,从而提高整个排序过程的效率。
堆是具有下列性质的完全二叉树:每个结点的值都小于或等于其左右孩子结点的值(称为小根堆),或每个结点的值都大于或等于其左右孩子结点的值(称为大根堆)。
堆排序的基本思想:
基本思想:首先将待排序的记录序列构造成一个堆,此时,选出了堆中所有记录的最大者,然后将它从堆中移走,并将剩余的记录再调整成堆,这样又找出了次小的记录,以此类推,直到堆中只有一个记录。
堆排序算法:
void HeapSort ( int r[], intn)
{
for (i=n/2; i>=1; i--) //初建堆
sift(r,i, n) ;
for (i=1; i>n; i++ )
{
r[1]←→r[n-i+1]; //移走堆顶
sift(r, 1, n-i); //重建堆
}
}
8.5 并归排序
8.5.1 二路并归排序的非递归实现
归并排序的主要操作是归并,
其主要思想是:将若干有序序列逐步归并,最终得到一个有序序列。
归并:将两个或两个以上的有序序列合并成一个有序序列的过程。
二路非递归排序
基本思想:将一个具有n个待排序记录的序列看成是n个长度为1的有序序列,然后进行两两归并,得到n/2个长度为2的有序序列,再进行两两归并,得到n/4个长度为4的有序序列,……,直至得到一个长度为n的有序序列为止。
一趟非递归算法排序:
void MergePass (int r[ ], int r1[ ], int n, int h)
{
i=1;
while (i≤n-2h+1) //情况1
{
Merge (r, r1, i, i+h-1, i+2*h-1);
i+=2*h;
}
if (i<n-h+1) Merge (r, r1, i, i+h-1, n); //情况2
else for (k=i; k<=n; k++) //情况3
r1[k]=r[k];
}
8.5.2 二路归并排序的地递归实现
void MergeSort2(intr[ ], int r1[ ], ints, int t)
{
if (s==t) r1[s]=r[s];
else {
m=(s+t)/2;
Mergesort2(r, r1, s, m);
Mergesort2(r, r1, m+1, t);
Merge(r1, r, s, m, t);
}
}
8.6 分配排序
8.6.1 桶式排序
分配排序是基于分配和收集的排序方法,
其基本思想是:先将待排序记录序列分配到不同的桶里,然后再把各桶中的记录依次收集到一起。
8.6.2 基数排序8.7 各种排序方法的比较