十种常用排序算法浅析附C++实现

最新推荐文章于 2023-04-24 11:06:44 发布

就爱吃西瓜

最新推荐文章于 2023-04-24 11:06:44 发布

阅读量805

点赞数

分类专栏：算法文章标签：排序算法算法 c 数据结构递归

本文链接：https://blog.csdn.net/lkasdolka/article/details/26266959

版权

算法专栏收录该内容

7 篇文章 0 订阅

订阅专栏

一、相关知识：

1、计算复杂度：（最差、平均、和最好性能），依据列表（list）的大小( n )。一般而言，好的性能是 O ( n log n )，且坏的性能是O( n ² )。对于一个排序理想的性能是 O ( n )。仅使用一个抽象关键比较运算的排序算法总平均上总是至少需要O( n log n )。

2、存储使用量：

3、稳定度：稳定排序算法会依照相等的关键（换言之就是值）维持纪录的相对次序。也就是一个排序算法是稳定的，就是当有两个有相等关键的纪录 R 和 S ，且在原本的列表中 R 出现在 S 之前，在排序过的列表中 R 也将会是在 S 之前。

二、排序算法的稳定性：

稳定：

冒泡排序（bubble sort）— O(n²)
插入排序（insertion sort）—O(n²)
桶排序（bucket sort）—O(n);需要O(k)额外空间
计数排序（counting sort）—O(n+k);需要O(n+k)额外空间
归并排序（merge sort）—O(n log n);需要O(n)额外空间
原地归并排序— O（n²）
二叉排序树排序（Binary tree sort）— O(n log n)期望时间; O(n²)最坏时间;需要O(n)额外空间
基数排序（radix sort）—O(n·k);需要O(n)额外空间

不稳定：（记住不稳定的，剩下的都是稳定的！！）

选择排序（selection sort）—O(n²)
希尔排序（shell sort）—O(n log n)如果使用最佳的现在版本
堆排序（heapsort）—O(n log n)
快速排序（quicksort）—O(n log n)期望时间, O(n²)最坏情况;对于大的、乱数列表一般相信是最快的已知排序

三、平均时间复杂度

平均时间复杂度由高到低为：

冒泡排序O(n²)
插入排序O(n²)
选择排序O(n²)
归并排序O(n log n)
堆排序O(n log n)
快速排序O(n log n)
希尔排序O(n^1.25)
基数排序O(n)

说明：虽然完全逆序的情况下，快速排序会降到选择排序的速度，不过从概率角度来说（参考信息学理论，和概率学），不对算法做编程上优化时，快速排序的平均速度比堆排序要快一些。

四、本文主要讲解的排序算法的结构图：

五、具体算法原理及实现

（1）冒泡排序（bubble sort）：

原理：它重复地走访过要排序的数列，一次比较两个元素，如果他们的顺序错误就把他们交换过来。走访数列的工作是重复地进行直到没有再需要交换，也就是说该数列已经排序完成。

复杂度：

实现：

VERSION 1：

VERSION 2：

（2）快速排序（quick sort）：

原理：快速排序使用分治法（Divide and conquer）策略来把一个串行（list）分为两个子串行（sub-lists）。

步骤为：

i.从数列中挑出一个元素，称为 "基准"（pivot），
ii重新排序数列，所有元素比基准值小的摆放在基准前面，所有元素比基准值大的摆在基准的后面（相同的数可以到任一边）。在这个分区退出之后，该基准就处于数列的中间位置。这个称为分区（partition）操作。
iii递归地（recursive）把小于基准值元素的子数列和大于基准值元素的子数列排序。递归的最底部情形，是数列的大小是零或一，也就是永远都已经被排序好了。虽然一直递归下去，但是这个算法总会退出，因为在每次的迭代（iteration）中，它至少会把一个元素摆到它最后的位置去。（当然，也有非递归的快排算法）

复杂度：

实现：

做了四种实现，参考了JULY大神的博客：http://blog.csdn.net/v_JULY_v/article/details/6262915

Version 1:

Version 2: 跟V1逻辑差不多，只是把第一个元素作为基准（pivot）

Version 3：

Version 4：这个版本采用的是非递归的方法，其实递归的实质也就是入栈出栈的过程

（3）直接选择排序（select_sort）

原理：在未排序序列中找到最小（大）元素，存放到排序序列的起始位置，然后，再从剩余未排序元素中继续寻找最小（大）元素，然后放到已排序序列的末尾。以此类推，直到所有元素均排序完毕。

复杂度：

实现：

（4）堆排序(heap_sort)

原理：利用堆（类似完全二叉树，且父结点值总是大于（大根堆）或小于（小根堆）子结点的值）这种数据结构设计的一种排序算法。

复杂度：

堆的操作：在堆的数据结构中，堆中的最大值总是位于根节点。堆中定义以下几种操作：

最大堆调整（Max_Heapify）：将堆的末端子节点作调整，使得子节点永远小于父节点
创建最大堆（Build_Max_Heap）：将堆所有数据重新排序
堆排序（HeapSort）：移除位在第一个数据的根节点，并做最大堆调整的递归运算

实现：

（5）直接插入排序（insertion_sort）

原理：它的工作原理是通过构建有序序列，对于未排序数据，在已排序序列中从后向前扫描，找到相应位置并插入。插入排序在实现上，通常采用in-place排序（即只需用到O(1)的额外空间的排序），因而在从后向前扫描过程中，需要反复把已排序元素逐步向后挪位，为最新元素提供插入空间。

复杂度：

实现：

（6）希尔排序（shell_sort ）

原理: 也称递减增量排序算法，是插入排序的一种更高效的改进版本。希尔排序是非稳定排序算法。希尔排序是基于插入排序的以下两点性质而提出改进方法的：

插入排序在对几乎已经排好序的数据操作时，效率高，即可以达到线性排序的效率
但插入排序一般来说是低效的，因为插入排序每次只能将数据移动一位

例如，假设有这样一组数[ 13 14 94 33 82 25 59 94 65 23 45 27 73 25 39 10 ]，如果我们以步长为5开始进行排序，我们可以通过将这列表放在有5列的表中来更好地描述算法，这样他们就应该看起来是这样：

13 14 94 33 82
25 59 94 65 23
45 27 73 25 39
10

然后我们对每列进行排序：

10 14 73 25 23
13 27 94 33 39
25 59 94 65 82
45

将上述四行数字，依序接在一起时我们得到：[ 10 14 73 25 23 13 27 94 33 39 25 59 94 65 82 45 ].这时10已经移至正确位置了，然后再以3为步长进行排序：

排序之后变为：

最后以1步长进行排序（此时就是简单的插入排序了）。本文采用的是n/2作为递归的步长。

复杂度：选用不同的步长计算，算法复杂度不同

实现：

（7）归并排序（merge_sort）

原理：该算法是采用分治法（Divide and Conquer）的一个非常典型的应用。归纳起来就是递归分解、然后合并

复杂度：

实现：

小结：以上七种排序算法都是基于比较元素大小的排序，故其平均性能下限为O(nlgn)。而下边要介绍的三种排序算法不是基于比较大小的原理的，因而可以突破O(nlgn)的下限，取得更好的性能（有时可以达到O(n)）。需要注意的是，三种线性时间排序算法都有各自特定的使用条件，需对号入座。

（8）桶排序(bucket_sort)

原理：假设输入服从均匀分布，不妨假设输入元素独立、均匀地分布在[0，1)上。桶排序的原理是将输入范围[0，1)划分为n个相同大小的子区间（子区间称为桶），然后将输入数分别放到各桶中，因为输入数据是均匀、独立地分布在[0，1)区间上，所以一般不会出现很多元素都在同一个桶中的情况。为了得到输出结果，我们先对每个桶中的数进行排序，然后遍历每个桶，按照次序把每个桶中的元素列出来即可。这里假设输入x分布[0，1)上，故可以选择f(x)=10*x作为映射函数。（下图是一个简单的桶排序的例子）