1.为什么要排序
查找是计算机应用中必不可少并且使用频率很高的一个操作。在一个排序表中查找一个元素,要比在一个无序表中查找效率高得多。所以为了提高查找效率,节省CPU时间,需要排序。
2.什么是排序
所谓排序,就是整理表中的数据几素,使之按儿素的关键字递增/递减的顺序排列。
3.排序的稳定性
当待排序元素的关键字不相同时,排序的结果是唯一的。如果待排序的表中,有多个关键字相间的元素:经过排序后这些共有相同关键字的元素之间的相对次序保持不变,则称这种排序方法是稳定的;反之,若具有相同关键字的元素之间的相对次序发生变化,则称这种的方法是不稳定的。
4.排序稳定性的意义
什么时候需要稳定的排序方法?什么时候不需要呢?
考虑一下这种情况:
原序列按关键字Ki排列,现在要求按关键字Km排列,期望:在结果序列中,关键字Km相同的记录按原关键字Ki排列!!
“主关键字相同,按原次关键字排列”
5.排序方法分类
(1)分类方法一
我们根据待排序的数据元素是否全部在内存中,我们把排序方法,分为两类:
内排序:整个排序元素都在内存中处理,不涉及内、外存的数据交换。
外排序:待排序元素有一部分不在内存(如:内存装不下)
(2)分类方法二
- 比较类排序:通过比较来决定元素间的相对次序,由于其时间复杂度不能突破O(nlogn),因此也称为非线性时间比较类排序。
- 非比较类排序:不通过比较来决定元素间的相对次序,它可以突破基于比较排序的时间下界,以线性时间运行,因此也称为线性时间非比较类排序。
6.排序算法性能评估
(1)算法的时间复杂度
评估一下算法 运行时间
T(n)=O(f(n))
(2)算法的空间复杂度
评估一下算法 所用空间
s(n)=O(f(n))
7.相关概念总结
- 稳定:如果a原本在b前面,而a=b,排序之后a仍然在b的前面。
- 不稳定:如果a原本在b的前面,而a=b,排序之后 a 可能会出现在 b 的后面。
- 时间复杂度:对排序数据的总的操作次数。反映当n变化时,操作次数呈现什么规律。
- **空间复杂度:**是指算法在计算机内执行时所需存储空间的度量,它也是数据规模n的函数。
排序算法可以分为内部排序和外部排序,内部排序是数据记录在内存中进行排序,而外部排序是因排序的数据很大,一次不能容纳全部的排序记录,在排序过程中需要访问外存。常见的内部排序算法有:插入排序、希尔排序、选择排序、冒泡排序、归并排序、快速排序、堆排序、基数排序等。用一张图概括:
关于时间复杂度
平方阶 (O(n2)) 排序 各类简单排序:直接插入、直接选择和冒泡排序。
线性对数阶 (O(nlog2n)) 排序 快速排序、堆排序和归并排序;
O(n1+§)) 排序,§ 是介于 0 和 1 之间的常数。 希尔排序
线性阶 (O(n)) 排序 基数排序,此外还有桶、箱排序。
关于稳定性
稳定的排序算法:冒泡排序、插入排序、归并排序和基数排序。
不是稳定的排序算法:选择排序、快速排序、希尔排序、堆排序。
名词解释:
- n:数据规模
- k:"桶"的个数
- In-place:占用常数内存,不占用额外内存
- Out-place:占用额外内存
- 稳定性:排序后 2 个相等键值的顺序和排序之前它们的顺序相同