排序
排序的基本概念
排序,就是重新排列表中的元素,使表中的元素满足按关键字有序的过程
评价指标
算法的稳定性,关键字相同的两个元素,在排序前后的相对位置不变,则称这个排序算法是稳定的,否则是不稳定的。
时间复杂度,空间复杂度
排序算法
内部排序目一关注如何使算法的时间复 杂度和空间复杂度更低
外部排序还要关注如何使读/写磁盘次数更少
1.插入排序
折半查找找到应插入的位置,仅适用于顺序表
注意:
一直到low> high时才停止折半查找。当mid所指元素等于当前元素时,应继续令low=mid+1,以保证"稳定性”。最终应将当前元素插入到low所指位置(即high+1)
比起直接插入排序,只减少了比较关键字的次数,时间复杂度仍是O(n2)
2.希尔排序
算法思想
先追求表中元素部分有序,再逐渐逼近全局有序
先将待排序表分割成若干形如L([i,i+d.,i+2d…i+kd]的”特殊"子表,对各个子表分别进行直接插入排序。缩小增量d,重复上述过程,直到d= 1为止。
3.冒泡排序
算法思想
从后往前(或从前往后)两两比较相邻元素的值,若为逆序(即A[i-1]>A[i]) ,则交换它们,直到序列比较完。称这样过程为“- 趟”冒泡排序。最多只需n-1趟则交换它们,直到序列比较完.称这样过程为“-趟”冒泡排序.最多只需n-1趟排序。
每一趟排序都可以使一个元素移动到最终位置, 已经确定最终位置的元素在之后的处理中无需再次对比。
如果某一趟排序过程中未发生“交换”,则算法可以提前结束。
每次交换都要移动元素三次
4.快速排序
5.简单排序
6.堆排序
堆排序(Heap Sort)是一种基于二叉堆数据结构的排序算法。它利用了堆的性质:在一个最大堆(或最小堆)中,父节点的值总是大于等于(或小于等于)其子节点的值。
堆排序的基本思想是:
- 将待排序的序列构建成一个最大堆(或最小堆)。
- 取出堆顶元素(最大值或最小值),将其与堆的最后一个元素交换。
- 缩小堆的范围,对剩余的元素重新调整为最大堆(或最小堆)。
- 重复步骤 2 和步骤 3,直到堆的大小为 1。
堆排序的时间复杂度为 O(nlogn),其中 n 为要排序的元素个数。由于堆排序是一种原地排序算法,空间复杂度为 O(1),因此它在空间利用上相对较好。但是,堆排序是一种不稳定的排序算法,因为在构建堆的过程中会破坏相同元素之间的相对顺序。
堆排序的实现通常分为两个步骤:建堆和排序。建堆阶段的时间复杂度为 O(n),排序阶段的时间复杂度为 O(nlogn)。
7.归并排序
8.基数排序
8.外部排序
外存与内存之间的数据交换
外部排序
:
1.数据元素太多,无法- -次全部读入内存进行排序
2.若要进行k路归并排序,则需要在内存中分配k个输入缓冲区和1个输出缓冲区
3.步骤
生成r个初始归并段(对L个记录进行内部排序,组成一个有序的初始归并段)
进行S趟k路归并, S=[logkr]- k越大, r越小,归并趟数越少,读写磁盘次数越少目
4.如何进行k路归并
把k个归并段的块读入k个输入缓冲区
用“归并排序”的方法从k个归并段中选出几个最小记录暂存到输出缓冲区中
每当一个输入缓冲区为空时,立即输入下一块待排数据
当输出缓冲区满时,写出外存
优化思路
多路归并
需要增加相应的输入缓冲区
每次从k个归并段中选一个最小元素需要 (k-1) 次关键字对比
采用多路归并可以减少归并趟数,从而减少磁盘I/O (读写)次数
减少初始归并段数量
若能增加初始归并段长度,则可减少初始归并段数量r
按照本节课介绍的方法生成的初始归并段,若共有N个记录,内存工作区可以容
纳L个记录,则初始归并段数量r=N/L
9.败者树
使用k路平衡归并策略,选出一个最小元素需要对比关键字(k-1) 次,导致内部.
归并所需时间增加-----可以用败者树解决!
败者树一可视为一 棵完全_ =叉树(多了一个头)。k个叶结点分别是当前参加比
什么是败者树
较的元素,非叶子结点用来记忆左右子树中的“失败者”,而让胜者往上继续进
行比较,-直到根结点
原理
每个叶子结点对应一个归并段
分支结点记录失败败者来自哪个归并段
根节点记录冠军来自哪个归并段
性能分析
对于k路归并,第一次构造败者树需要对比关键字k-1次
有了败者树,选出最小元素,只需对比关键字[log2 k]次
10.置换选择排序
若共有N个记录,内存工作区可以容纳L个记录,则初始归并段数量r=N/L-
可用“置换选择排序"进-步减少初始归并数量
设初始待排文件为FI,初始归并段输出文件为FO,内存工作区为WA, FO和WA
的初始状态为空,WA可容纳w个记录。置换选择算法的步骤如下
1.从FI输入w个记录到工作区WA
2.从WA中选出其中关键字取最小值的记录,记为MINIMAX记录
3.将MINIMAX记录输出到FO去
4.若FI不空,则从FI输入下一个记录到WA中
5.从WA中所有关键字比MINIMAX记录的关键字大的记录中选出最小关键字记
录,作为新的MINIMAX记录
6.重复3-5,直至在WA中选不出新的MINIMAX记录为止,由此得到一个初始归
并段,输出一个归并段的结束标志到FO中去
7.重复2-6,直至WA为空,由此得到全部初始归并段