11. 内部排序
11.1排序的定义
11.1.1 排序
就是使一串记录,按照其中的某个或某些关键字的大小,递增或递减的排列起来的操作
11.1.2 稳定性
假定在待排序的记录序列中,存在多个具有相同的关键字的记录,若经过排序,这些记录的相对次 序保持不变,即在原序列中,r[i]=r[j],且r[i]在r[j]之前,而在排序后的序列中,r[i]仍在r[j]之前,则称这种排 序算法是稳定的;否则称为不稳定的.
11.2排序的分类
11.2.1 内部排序
指的是待排序记录存放在计算机随机存储器中进行的排序过程,即数据元素全部放在内存中的排序.
11.2.2 外部排序
指的是待排序记录的数量很大,以致内存一次不能容纳全部记录,在排序过程中尚需对外存进行访问的排序过程.,即数据元素太多不能同时放在内存中,根据排序过程的要求不能在内外存之间移动数据的排序.
11.3 常见的排序算法
11.3.1 比较类型的排序算法
(1) 插入排序
直接插入排序
基本思想
把待排序的记录按其关键码值的大小逐个插入到一 个已经排好序的有序序列中,直到所有的记录插入完为止,得到一个新的有序序列 .
特性总结
1. 元素集合越接近有序,直接插入排序算法的时间效率越高;
2. 时间复杂度:O(N^2) ;
3. 空间复杂度:O(1),它是一种稳定的排序算法;
4. 稳定性:稳定.
其他插入排序
折半查找排序
2-路插入排序
表插入排序
希尔排序(缩小增量排序)
基本思想
先选定一个整数,把待排序文件中所有记录分成个 组,所有距离为的记录分在同一组内,并对每一组内的记录进行排序。然后,取,重复上述分组和排序的工 作。当到达=1时,所有记录在统一组内排好序。
特性总结
1. 希尔排序是对直接插入排序的优化;
2. 当gap > 1时都是预排序,目的是让数组更接近于有序。当gap == 1时,数组已经接近有序的了,这样就 会很快。这样整体而言,可以达到优化的效果。我们实现后可以进行性能测试的对比
3. 希尔排序的时间复杂度不好计算,需要进行推导,推导出来平均时间复杂度: O(N^1.3—N^2)
4. 稳定性:不稳定
(2) 选择排序
基本思想
每一次从待排序的数据元素中选出最小(或最大)的一个元素,存放在序列的起始位置,直到全部待排序的 数据元素排完 。
直接选择排序
基本思想
在元素集合array[i]--array[n-1]中选择关键码最大(小)的数据元素
若它不是这组元素中的最后一个(第一个)元素,则将它与这组元素中的最后一个(第一个)元素交换
在剩余的array[i]--array[n-2](array[i+1]--array[n-1])集合中,重复上述步骤,直到集合剩余1个元素
特性总结
1. 直接选择排序思考非常好理解,但是效率不是很好。实际中很少使用
2. 时间复杂度:O(N^2)
3. 时间复杂度: O(1)
4. 稳定性:不稳定
堆排序
基本思想
堆排序(Heapsort)是指利用堆积树(堆)这种数据结构所设计的一种排序算法,它是选择排序的一种。它是 通过堆来进行选择数据。需要注意的是排升序要建大堆,排降序建小堆。
特性总结
1. 堆排序使用堆来选数,效率就高了很多。
2. 时间复杂度:O(N*logN)
3. 空间复杂度:O(1)
4. 稳定性:不稳定
(3) 交换排序
基本思想
所谓交换,就是根据序列中两个记录键值的比较结果来对换这两个记录在序列中的位置,交换排 序的特点是:将键值较大的记录向序列的尾部移动,键值较小的记录向序列的前部移动.
冒泡排序(起泡排序)
基本思想
...............
特性总结
1. 冒泡排序是一种非常容易理解的排序
2. 时间复杂度:O(N^2)
3. 空间复杂度:O(1)
4. 稳定性:稳定
快速排序
基本思想
快速排序是Hoare于1962年提出的一种二叉树结构的交换排序方法,其基本思想为:任取待排序元素序列中 的某元素作为基准值,按照该排序码将待排序集合分割成两子序列,左子序列中所有元素均小于基准值,右 子序列中所有元素均大于基准值,然后最左右子序列重复该过程,直到所有元素都排列在相应位置上为止。
将区间按照基准值划分为左右两半部分的常见方式
1. hoare版本
2. 挖坑法
3. 前后指针版本
2.3.2 快速排序优化
2.3.2 快速排序非递规
特性总结
1. 快速排序整体的综合性能和使用场景都是比较好的,所以才敢叫快速排序
2. 时间复杂度:O(N*logN)
3. 空间复杂度:O(logN)
4. 稳定性:不稳定
(4) 归并排序
基本思想
归并排序(MERGE-SORT)是建立在归并操作上的一种有效的排序算法,该算法是采用分治法(Divide and Conquer)的一个非常典型的应用。将已有序的子序列合并,得到完全有序的序列;即先使每个子序列有 序,再使子序列段间有序。若将两个有序表合并成一个有序表,称为二路归并
特性总结
1. 归并的缺点在于需要O(N)的空间复杂度,归并排序的思考更多的是解决在磁盘中的外排序问题。
2. 时间复杂度:O(N*logN)
3. 空间复杂度:O(N)
4. 稳定性:稳定
11.3.2 非比较类型的排序算法
(1) 基数排序
基本思想
计数排序又称为鸽巢原理,是对哈希直接定址法的变形应用
操作步骤
1. 统计相同元素出现次数
2. 根据统计的结果将序列回收到原来的序列中
特性总结
1. 计数排序在数据范围集中时,效率很高,但是适用范围及场景有限。
2. 时间复杂度:O(MAX(N,范围))
3. 空间复杂度:O(范围)
4. 稳定性:稳定
(2) 计数排序
11.4 排序算法的复杂度结稳定性分析
11.5 各种内部排序方法的比较讨论
12.外部排序
12.1 外部排序的定义
指的是待排序记录的数量很大,以致内存一次不能容纳全部记录,在排序过程中尚需对外存进行访问的排序过程.,即数据元素太多不能同时放在内存中,根据排序过程的要求不能在内外存之间移动数据的排序.
12.2 外部信息的获取
12.2.1 计算机存储器的分类
内存储器(主存)
信息可随机存取,且存取速度快,但价格昂贵,容量小;
外存储器(辅存)
包括磁带和磁盘(或磁鼓),前者为顺序存取的设备,后者为随机存取的设备.
12.2.2 磁带信息的存取
12.2.3 磁盘信息的存取
12.2 外部排序的方法
外部排序基本上是由两个相对独立的阶段组成,,首先,按可用内存大小,将外存上含n个记录的文件分成若干长度为l的子文件或段(segment),依次读入内存并利用有效的内部排序方法对他们进行排序,并将排序后所得的有序子文件重新写入外存,通常这些有序子文件为归并段或顺串.
对这些归并段进行逐趟归并,使归并段逐渐由小至大,直至得到整个有序文件为止.
12.3 多路平衡归并的实现
12.4 置换_选择排序
是在树形选择排序的基础上得来的,特点:在整个排序(得到所有初始归并段)的过程中,选择最小(或最大)关键字和输入,输出交叉或平行进行.
12.5 最佳归并树
DS_(11. 内部排序/12.外部排序)
最新推荐文章于 2020-12-06 13:59:48 发布