几种排序算法梳理总结

最新推荐文章于 2022-07-21 14:25:06 发布

百香果-惜时

最新推荐文章于 2022-07-21 14:25:06 发布

阅读量300

点赞数

文章标签：数据结构排序算法 java 算法快速排序

本文链接：https://blog.csdn.net/bxg1234/article/details/105577644

版权

排序的分类：

分为内部排序和外部排序，其中内部排序分为插入排序、选择排序、交换排序、归并排序和基数排序。插入排序包括直接插入排序和希尔排序；选择排序包括简单选择排序和堆排序；交换排序包括冒泡排序和快速排序。

几种排序算法基本思想

1.冒泡排序

(1) 基本思想：通过对待排序序列从前向后（从下标较小的元素开始），依次比较相邻元素的值，若发现逆序则交换，使值较大的元素逐渐从前移向后部，最大值先出现在最右端。时间复杂度：
(2) 优化：因为排序的过程中，各元素不断接近自己的位置，如果一趟比较下来没有进行过交换，就说明序列有序，因此可以在排序过程中设置一个标志flag判断元素是否进行过交换，从而减少不必要的比较。如果在某一趟遍历中，发现没有发生一次交换，可以提前结束冒泡算法。

时间复杂度

最优的(数组已经排好)时间复杂度为：O( n^2 ) ；加了优化算法(标志)后O(n)；
最差的(数组为逆序)时间复杂度为：O( n^2 )；
平均的时间复杂度为：O( n^2 )；
空间复杂度

空间复杂度就是在交换元素时那个临时变量所占的内存空间；
最优的空间复杂度就是开始元素顺序已经排好了，则空间复杂度为：0；
最差的空间复杂度就是开始元素逆序排序了，则空间复杂度为：O(n)；
平均的空间复杂度为：O(1)；

2.选择排序

（1）基本思想：每次选择一个固定位置(从0角标开始)与其他位置比较，将较小的值放在0角标处。最小值先出现在0角标处，依此类推。

时间复杂度
时间复杂度为：O(n2)。每一个元素都要遍历一次，n*n。
空间复杂度

空间复杂度是O(1)。
第一次从arr[0]arr[n-1]中选取最小值，与arr[0]交换，第二次从arr[1]arr[n-1]中选取最小值，与arr[1]交换，，第三次从arr[2]arr[n-1]中选取最小值，与arr[2]交换，，，，第i次从arr[i-1]arr[n-1]中选取最小值，与arr[i-1]交换，.，，第n-1次从arr[n-2]~arr[n-1]中选取n-最小值，与arr[n-2]交换，总共通过n-1次，得到一个按排序码从小到大排列的有序序列。选择排序是不稳定的排序方法。

3.快速排序

（1）基本思想是：其实快速排序的本质就是把基准数大的都放在基准数的右边,把比基准数小的放在基准数的左边,这样就是给基准数据找其正确索引位置的过程。通过一趟排序将要排序的数据分割成独立的两部分，其中一部分的所有数据都比另外一部分的所有数据都要小，然后再按此方法对这两部分数据分别进行快速排序，整个排序过程可以递归进行，以此达到整个数据变成有序序列。

(假设最开始的基准数据为数组第一个元素23,则首先用一个临时变量去存储基准数据,即tmp=23;然后分别从数组的两端扫描数组，设两个指示标志:low指向起始位置，high指向末尾。首先从后半部分开始，如果扫描到的值大于基准数据就让high减1,如果发现有元素比该基准数据的值小(如上图中18<=tmp)，就将high位置的值赋值给low位置，然后开始从前往后扫描,如果扫描到的值小于基准数据就让low加1,如果发现有元素大于基准数据的值(如上图46=>tmp)，就再将low位置的值赋值给high位置的值,这样一遍走下来,可以很清楚的知道,其实快速排序的本质就是把基准数大的都放在基准数的右边,把比基准数小的放在基准数的左边,这样就找到了该数据在数组中的正确位置。以后采用递归的方式分别对前半部分和后半部分排序，当前半部分和后半部分均有序时该数组就自然有序了。)

时间复杂度
最优的情况下时间复杂度为：O( nlogn )
快速排序最差的情况下时间复杂度为：O( n^2 )
平均时间复杂度也是：O(nlogn)
空间复杂度
最优的情况下空间复杂度为：O(logn) ；每一次都平分数组的情况
最差的情况下空间复杂度为：O( n ) ; 退化为冒泡排序的情况

4.插入排序

（1）基本思想：把n个待排序的元素看成为一个有序表和一个无序表，开始时有序表中只包含一个元素，无序表中包含有n-1个元素，排序过程中每次从无序表中取出第一个元素，把它的排序码依次与有序表元素的排序码进行比较，把它插入到有序表中的适当位置，使之成为新的有序表。

时间复杂度：

最坏的情况（每次插入都遍历一遍已经排好序的数组）：
外层循环n-1次，内层循环1+2+3+…+(n-2)=(n-2)(n-1)/2次所以最坏情况是O(n^2)
最好的情况（已经有序）：O(n)
平均情况为：(n^2 + n)/2，
所以插入排序算法的时间复杂度为O(n^2)
空间复杂度：

空间只有一个辅助变量，所以为O(1)

5.希尔排序（shell排序）

（1）基本思想：希尔排序是把序列按下标的一定增量分组，对每组使用直接插入排序算法排序(是直接插入排序的改进版本)；随着增量的逐渐减少，每组包含的关键词越来越多，当增量减至1时，整个序列恰好被分为一组，算法便终止。

时间复杂度

希尔排序的时间复杂度是：O（nlogn）～O（n2）

6.归并排序：

（1）归并排序的分治思想：

分解：分解待排序的n个元素序列为各具n/2个元素的子序列
解决：使用归并排序递归地对子序列排序
合并：合并两个已排序的子序列

时间复杂度

对于最好，最坏和平均情况，问题都要将规模分解到1为止，所以三者的时间复杂度相同。一般用于对总体无序，但是各子项相对有序的数列。
通过画递归树分析可知T(n) = cnlgn + cn, 时间复杂度为o(nlogn)。

7. java中Arrays.sort

 使用了两种排序方法:快速排序和优化的合并排序。

快速排序主要是对哪些基本类型数据（int,short,long等）排序，而合并排序用于对对象类型进行排序。使用不同类型的排序算法主要是由于快速排序是不稳定的，而合并排序是稳定的。这里的稳定是指比较相等的数据在排序之后仍然按照排序之前的前后顺序排列。对于基本数据类型，稳定性没有意义，而对于对象类型，稳定性是比较重要的，因为对象相等的判断可能只是判断关键属性，最好保持相等对象的非关键属性的顺序与排序前一直；另外一个原因是由于合并排序相对而言比较次数比快速排序少，移动（对象引用的移动）次数比快速排序多，而对于对象来说，比较一般比移动耗时。

排序算法稳定性

首先，排序算法的稳定性大家应该都知道，通俗地讲就是能保证排序前2个相等的数其在序列的前后位置顺序和排序后它们两个的前后位置顺序相同。在简单形式化一下，如果Ai = Aj，Ai原来在位置前，排序后Ai还是要在Aj位置前。

(1)冒泡排序

冒泡排序就是把小的元素往前调或者把大的元素往后调。比较是相邻的两个元素比较，交换也发生在这两个元素之间。所以，如果两个元素相等，我想你是不会再无聊地把他们俩交换一下的；如果两个相等的元素没有相邻，那么即使通过前面的两两交换把两个相邻起来，这时候也不会交换，所以相同元素的前后顺序并没有改变，所以冒泡排序是一种稳定排序算法。
(2)选择排序

选择排序是给每个位置选择当前元素最小的，比如给第一个位置选择最小的，在剩余元素里面给第二个元素选择第二小的，依次类推，直到第n - 1个元素，第n个元素不用选择了，因为只剩下它一个最大的元素了。那么，在一趟选择，如果当前元素比一个元素小，而该小的元素又出现在一个和当前元素相等的元素后面，那么交换后稳定性就被破坏了。比较拗口，举个例子，序列5 8 5 2 9，我们知道第一遍选择第1个元素5会和2交换，那么原序列中2个5的相对前后顺序就被破坏了，所以选择排序不是一个稳定的排序算法。
(3)插入排序

插入排序是在一个已经有序的小序列的基础上，一次插入一个元素。当然，刚开始这个有序的小序列只有1个元素，就是第一个元素。比较是从有序序列的末尾开始，也就是想要插入的元素和已经有序的最大者开始比起，如果比它大则直接插入在其后面，否则一直往前找直到找到它该插入的位置。如果碰见一个和插入元素相等的，那么插入元素把想插入的元素放在相等元素的后面。所以，相等元素的前后顺序没有改变，从原无序序列出去的顺序就是排好序后的顺序，所以插入排序是稳定的。
(4)快速排序

快速排序有两个方向，左边的i下标一直往右走，当a[i] <= a[center_index]，其中center_index是中枢元素的数组下标，一般取为数组第0个元素。而右边的j下标一直往左走，当a[j] > a[center_index]。如果i和j都走不动了，i <= j，交换a[i]和a[j],重复上面的过程，直到i > j。交换a[j]和a[center_index]，完成一趟快速排序。在中枢元素和a[j]交换的时候，很有可能把前面的元素的稳定性打乱，比如序列为5 3 3 4 3 8 9 10 11，现在中枢元素5和3（第5个元素，下标从1开始计）交换就会把元素3的稳定性打乱，所以快速排序是一个不稳定的排序算法，不稳定发生在中枢元素和a[j] 交换的时刻。
(5)归并排序

归并排序是把序列递归地分成短序列，递归出口是短序列只有1个元素（认为直接有序）或者2个序列（1次比较和交换），然后把各个有序的段序列合并成一个有序的长序列，不断合并直到原序列全部排好序。可以发现，在1个或2个元素时，1个元素不会交换，2个元素如果大小相等也没有人故意交换，这不会破坏稳定性。在短的有序序列合并的过程中，如果两个当前元素相等时，我们把处在前面的序列的元素保存在结果序列的前面，这样就保证了稳定性。所以，归并排序也是稳定的排序算法。
(6)基数排序

基数排序是按照低位先排序，然后收集；再按照高位排序，然后再收集；依次类推，直到最高位。有时候有些属性是有优先级顺序的，先按低优先级排序，再按高优先级排序，最后的次序就是高优先级高的在前，高优先级相同的低优先级高的在前。基数排序基于分别排序，分别收集，所以其是稳定的排序算法。
(7)希尔排序(shell)

希尔排序是按照不同步长对元素进行插入排序，当刚开始元素很无序的时候，步长最大，所以插入排序的元素个数很少，速度很快；当元素基本有序了，步长很小，插入排序对于有序的序列效率很高。所以，希尔排序的时间复杂度会比O(n^2)好一些。由于多次插入排序，我们知道一次插入排序是稳定的，不会改变相同元素的相对顺序，但在不同的插入排序过程中，相同的元素可能在各自的插入排序中移动，最后其稳定性就会被打乱，所以shell排序是不稳定的。
(8)堆排序

我们知道堆的结构是节点i的孩子为2 * i和2 * i + 1节点，大顶堆要求父节点大于等于其2个子节点，小顶堆要求父节点小于等于其2个子节点。在一个长为n 的序列，堆排序的过程是从第n / 2开始和其子节点共3个值选择最大（大顶堆）或者最小（小顶堆），这3个元素之间的选择当然不会破坏稳定性。但当为n / 2 - 1， n / 2 - 2， … 1这些个父节点选择元素时，就会破坏稳定性。有可能第n / 2个父节点交换把后面一个元素交换过去了，而第n / 2 - 1个父节点把后面一个相同的元素没有交换，那么这2个相同的元素之间的稳定性就被破坏了。所以，堆排序不是稳定的排序算法。
综上，得出结论: 选择排序、快速排序、希尔排序、堆排序不是稳定的排序算法，而冒泡排序、插入排序、归并排序和基数排序是稳定的排序算法。