Chapter7. Sorting algorithm summary C++/Python 排序算法总结

最新推荐文章于 2020-06-06 10:07:27 发布

apple_lover_yxy

最新推荐文章于 2020-06-06 10:07:27 发布

阅读量686

点赞数

本文链接：https://blog.csdn.net/apple_lover_yxy/article/details/43395443

版权

data structure & algorithm 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

排序包括内部排序和外部排序。内部排序包括插入排序，选择排序，交换排序，归并排序，基数排序。插入排序包括直接插入排序和希尔排序，选择排序包括简单选择排序和堆排序，交换排序包括冒泡排序和快速排序。

Straight Insertion sort 直接插入排序

将一个记录插入到已排好的有序表中，从而得到一个新的记录数增1的有序表。即，先将序列的第一个记录看成是一个有序的子序列，然后从第2个记录逐个进行插入，直至整个序列有序为止。

Key: 设立哨兵，作为临时存储和判断数组边界之用。

Example:

当碰到一个和插入元素相等的，插入元素把想插入的元素放在相等元素的后面。插入排序是稳定的。

C++算法实现：

时间复杂度 O(n^2) .

Python 算法实现:

Binary Insertion sort 二分插入排序

先跟序列最中间的那个元素比较，如果比最中间的这个元素小，则插入位置在它的左边，否则在它的右边。

以当前最中间位置为分割点，如果在左边，则当前最中间位置是待搜索子序列的终点，如果在右边，右边邻接的元素将是待搜索子序列的起点。按照这种原则继续寻找下一个中间位置，并继续这种过程，直到找到合适的插入位置为止。

最坏的情况下二分插入排序的时间复杂度依然是 O(n^2)。如果待排序的序列已经有序，排序时间复杂度为O(nlogn)。

C++算法实现：

Python 算法实现：

Shell sort 希尔排序

相对直接排序有较大改进。希尔排序又叫缩小增量排序。

先将整个待排序的记录分割成为若干子序列分别进行直接插入排序，待整个序列中的记录“基本有序”时，再对全体记录进行依次直接插入排序。

操作方法：

1. 选择一个增量序列 t1, t2, .., tk, 其中 ti>tj, tk=1;

2. 按增量序列个数k, 对序列进行k趟排序；

3. 每趟排序，根据对应的增量ti，将待排序列分割成若干长度为m 的子序列，分别对各子表进行直接插入排序。仅增量因子为1时，整个序列作为一个表来处理，表长度即为整个序列的长度。

C++算法实现：

Python 算法实现：

希尔排序时效分析较难，比较次数与记录移动次数依赖于增量因子序列 gap 的选取，特定情况下可以准确估算出关键码的比较次数和记录的移动次数。是一个不稳定的排序方法。

Selection sort 选择排序

在要排序的一组数中，选出最小(或者最大)的一个数与第1个位置的数交换；然后在剩下的数当中再找最小 (或者最大) 的与第2个位置的数交换，依次类推，直到第n-1个元素(倒数第二个数) 和第n个元素(最后一个数)比较为止。

操作方法：

第一轮，从n个记录中找出关键码最小的记录与第一个记录交换；

第二轮，从第二个记录开始的n-1个记录中再选出关键码最小的记录与第二个记录交换；

第i 轮，从第i 个记录开始的 n-i+1个记录中选出关键码最小的记录与第i 个记录交换；

直到整个序列按关键码有序。

C++算法实现：

Python算法实现：

Heap sort 堆排序

堆排序是一种树形选择排序，是对直接选择排序的有效改进。

堆的定义：具有n个元素的序列(k1,k2,...,kn)，当且仅当满足

时称之为堆。

若以一维数组存储一个堆，则堆对应一棵完全二叉树，且所有非叶结点的值均不大于(或不小于)其子女的值，根结点(堆顶元素)的值是最小(或最大)的。如：

(a) 大顶堆序列：(96,83,27,38,11,09)

(b) 小顶堆序列：(12,36,24,85,47,30,53,91)

初始时把要排序的n个数的序列看作是一棵顺序存储的二叉树(一维数组存储二叉树)，调整它们的存储序，使之成为一个堆，将堆顶元素输出，得到n个元素中最小(或最大)的元素，这时堆的根节点的数最小(或者最大)。然后对前面(n-1)个元素重新调整使之成为堆，输出堆顶元素，得到n个元素中次小(或此大)的元素。依次类推，直到只有两个节点的堆，并对它们作交换，最后得到有n个节点的有序序列。这个过程为堆排序。

因此，实现堆排序需要解决两个问题：

1. 如何将n个待排序的数建成堆；

2. 输出堆顶元素后，怎样调整剩余n-1个元素，使其成为一个新堆。

输出堆顶元素后，对剩余n-1个元素重新建成堆的调整过程。

调整小顶堆的方法：

1）设有m个元素的堆，输出堆顶元素后，剩下m-1个元素。将堆底元素送入堆顶(最后一个元素与堆顶进行交换)，堆被破坏，其原因仅是根结点不满足堆的性质。

2）将根结点与左，右子树中较小元素的进行交换。

3）若与左子树交换：如果左子树堆被破坏，即左子树的根结点不满足堆的性质，则重复方法（2）。

4）若与右子树交换，如果右子树堆被破坏，即右子树的根结点不满足堆的性质，则重复方法（2）。

5）继续对不满足堆性质的子树进行上述交换操作，直到叶子结点，堆被建成。

称这个自根结点到叶子结点的调整过程为筛选。

对n个元素初始建堆的过程。

建堆方法：对初始序列建堆的过程，就是一个反复进行筛选的过程。

1）n个结点的完全二叉树，则最后一个结点是第［n/2] 个结点的子树。

2）筛选从第[n/2]个结点为根的子树开始，该子树成为堆。

3) 之后向前依次对各结点为根的子树进行筛选，使之成为堆，直到根结点。

如图建堆初始过程：无序序列：(49, 38, 65, 97,76, 13, 27, 49)

算法实现：从算法描述来看，堆排序需要两个过程，一是建立堆，二是堆顶与堆的最后一个元素交换位置。所以堆排序有两个函数组成。一是建堆的渗透函数，二是反复调用渗透函数实现排序的函数。

C++算法实现：

Python 算法实现：

设树的深度为k，k＝[log2n]+1，从根到叶的筛选，元素比较次数至多2(k-1)次，交换记录至多k次。所以，在建好堆后，排序过程中的筛选次数不超过下式：

而建堆时的比较次数不超过4n次，因此堆排序最坏情况下，时间复杂度也为：O(nlogn)。

Bubble sort 冒泡排序

在要排序的一组数中，对当前还未排好序的范围内的全部数，自上而下对相邻的两个数依次进行比较和调整，让较大的数往下沉，较小的往上冒。即：每当两相邻的数比较后发现它们的排序与排序要求相反时，就将它们互换。

C++算法实现：

Python算法实现：

Quick sort 快速排序

基本思想：

1）选择一个基准元素，通常选择第一个元素或者最后一个元素

2）通过一趟排序讲待排序的记录分割成独立的两部分，其中一部分记录的元素值均比基准元素值小。另一部分记录的元素值比基准值大。

3）此时基准元素在其排好序后的正确位置

4）然后分别对这两部分记录用同样的方法继续进行排序，直到整个序列有序。

排序过程：

C++算法实现：

Python算法实现：

快速排序通常被认为在同数量级 (O(nlog2n))的排序方法中平均性能最好。快速排序是一个不稳定的排序方法。

Merge sort 归并排序

归并排序法是将两个(或两个以上) 有序表合并成一个新的有序表，即把待排序序列分为若干个子序列，每个子序列是有序的。然后再把有序子序列合并为整体有序序列。

合并方法：

设r[i...n]由两个有序子表r[i,...m]和r[m+1...n]组成，两个子表长度分别为m-i+1和n-m。

1. j=m+1; k=i; i=i; //置两个子表的起始下标及辅助数组的起始下标

2. 若i>m 或 j>n，转(4) //其中一个子表已合并完，比较选取结束

3. //选取r[i]和r[j] 较小的存入辅助数组rf

如果r[i]<r[j]，rf[k]=r[i]; i++; k++; 转(2)

否则，rf[k]=r[j]；j++; k++;转(2)

4,//将尚未处理完的子表中元素存入rf

如果i<=m，将r[i...m]存入rf[k...n] //前一子表非空

如果j<=n，将r[j...n]存入rf[k...n] //后一子表非空

5. 合并结束

1个元素的表总是有序的。所以对n个元素的待排序列，每个元素可以看成1个有序子表。对子表两两合并生成n/2个子表，所得子表除最后一个子表长度可能为1外，其余子表长度均为2。再进行两两合并，直到生成n个元素按关键码有序的表。

C++ 算法实现：

Python 算法实现：

归并排序算法中，在合并两个已排序的表时，通常的做法时新建一个大小等于它们之和的新表，用于存储这两个表合并的结果，然后把合并后的表在拷贝回这两个连续的表中。另外一个做法，也可以不分配新的空间存储结果，而是使用插入排序的思想进行合并。

使用分配空间合并的方式，时间复杂度为O(nlogn)，使用插入合并方式，时间复杂度为 O(n^2)。

Radix sort 基数排序

是按照低位先排序，然后收集；再按照高位排序，然后再收集；依次类推，直到最高位。有时候有些属性是有优先级顺序的，先按低优先级排序，再按高优先级排序。最后的次序就是高优先级高的在前，高优先级相同的低优先级高的在前。基数排序基于分别排序，分别收集，所以是稳定的。

C++算法实现：

算法时间复杂度计算：

1. 计算出基本操作的执行次数 T(n)

基本操作即算法中的每条语句(以；为分割)，语句的执行次数也叫做语句的频度。在做算法分析时，一般默认为考虑最坏的情况。

2. 计算出T(n) 的数量级

求T(n) 的数量级，只要将T(n) 进行如下操作：

忽略常量，低次幂和最高次幂的系数，令 f(n)=T(n)的数量级。

3. 用大O来表示时间复杂度

当n趋近无穷大时，如果lim(T(n)/f(n))的值为不等于0的常数，则称f(n)是T(n)的同数量级函数。记作 T(n)=O(f(n))。

简化步骤：

1. 找到执行次数最多的语句

2. 计算语句执行次数的数量级

3. 用大O来表示结果

复杂度为 c, log2n, n, n*log2n, 这个算法时间效率比较高，如果是 2n, 3n, n! 会很差。

apple_lover_yxy

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Chapter7. Sorting algorithm summary C++/Python 排序算法总结

排序包括内部排序和外部排序。内部排序包括插入排序，选择排序，交换排序，归并排序，基数排序。插入排序包括直接插入排序和希尔排序，选择排序包括简单选择排序和堆排序，交换排序包括冒泡排序和快速排序。
复制链接

扫一扫