排序是最常使用到的一种算法类型,很大编程语言中都内置排序函数。这里主要是记录下述三种不同时间复杂度的排序算法。
目录
如何分析排序算法?
- 执行效率:
针对不同有序度的数据,排序算法的执行效率是存在差异的。所以需要做不同情况下的时间复杂度分析,而能够分辨出最好情况和最坏情况对应的数据,可以对排序算法的原理理解更加深入。
分析排序算法的数据特征会采用有序度这个概念,指数组中具有有序关系的元素对的个数。可参考下图有个直观感受:
对于一个倒序排列的数组,比如 6,5,4,3,2,1,有序度是 0;对于一个完全有序的数组,比如 1,2,3,4,5,6,有序度就是 n*(n-1)/2,也就是 15。我们把这种完全有序的数组的有序度叫作满有序度。逆序度的定义正好跟有序度相反(默认从小到大为有序),逆序度 = 满有序度 - 有序度。我们排序的过程就是一种增加有序度,减少逆序度的过程,最后达到满有序度,就说明排序完成了。
虽然我们在分析时间复杂度时经常忽略系数、常数、低阶,但这都是在数据规模很大的时候。实际应用场景下,数据规模不一定特别大,或者需要在相同量级时间复杂度的算法之间做比较,这个时候就要把之前忽略的细节再拿出来分析。
基于比较的排序算法在执行过程会涉及两种基本操作,一种是元素比较大小,另一种是元素交换或移动。对比分析时可以将这两种代码操作次数专门进行分析。
- 内存消耗:
针对排序算法专门有个原地排序(Sorted in place)的概念,特指空间复杂度是 O(1) 的排序算法,也就是利用原始数据保存的内存空间来进行主要操作。
- 稳定性:
稳定性是排序算法中非常重要的一个概念,指排序前后相同元素之间的先后顺序保持不变。对应到实际应用场景,可以想象Excel中的多键排序,在有主键排序的基础上,还有一个次键排序。等于是两次排序叠加的结果,如果不是稳定排序算法,那么就无法实现排序叠加,第二次排序会打乱第一次排序的结果。
冒泡排序
冒泡排序,通过字面意思联想,就像鱼吐泡泡一样,气泡会逐渐上浮到水面。原理上是通过相邻元素的比较,如果较大值在较小值前面就进行一次位置互换。这样一次冒泡操作就会让一个极大值往上移动到其应该在的位置。优化,如果某次冒泡操作已经没有数据交换时,说明已经达到完全有序,不用再继续执行后续的冒泡操作。
下图分别是一次冒泡操作和整个冒泡排序的过程: