Chapter7. Sorting algorithm summary C++/Python 排序算法总结

排序包括内部排序和外部排序。内部排序包括 插入排序,选择排序,交换排序,归并排序,基数排序。插入排序包括直接插入排序和希尔排序,选择排序包括简单选择排序和堆排序,交换排序包括冒泡排序和快速排序。


Straight Insertion sort 直接插入排序

将一个记录插入到已排好的有序表中,从而得到一个新的记录数增1的有序表。即,先将序列的第一个记录看成是一个有序的子序列,然后从第2个记录逐个进行插入,直至整个序列有序为止。

Key: 设立哨兵,作为临时存储和判断数组边界之用。

Example: 


当碰到一个和插入元素相等的,插入元素把想插入的元素放在相等元素的后面。插入排序是稳定的。

C++算法实现:


时间复杂度 O(n^2) .

Python 算法实现:



Binary Insertion sort 二分插入排序

先跟序列最中间的那个元素比较,如果比最中间的这个元素小,则插入位置在它的左边,否则在它的右边。

以当前最中间位置为分割点,如果在左边,则当前最中间位置是待搜索子序列的终点,如果在右边,右边邻接的元素将是待搜索子序列的起点。按照这种原则继续寻找下一个中间位置,并继续这种过程,直到找到合适的插入位置为止。

最坏的情况下二分插入排序的时间复杂度依然是 O(n^2)。如果待排序的序列已经有序,排序时间复杂度为O(nlogn)。

C++算法实现:


Python 算法实现:



Shell sort 希尔排序

相对直接排序有较大改进。希尔排序又叫缩小增量排序。

先将整个待排序的记录分割成为若干子序列分别进行直接插入排序,待整个序列中的记录“基本有序”时,再对全体记录进行依次直接插入排序。

操作方法:

1. 选择一个增量序列 t1, t2, .., tk, 其中 ti>tj, tk=1;

2. 按增量序列个数k, 对序列进行k趟排序;

3. 每趟排序,根据对应的增量ti,将待排序列分割成若干长度为m 的子序列,分别对各子表进行直接插入排序。仅增量因子为1时,整个序列作为一个表来处理,表长度即为整个序列的长度。


C++算法实现:


Python 算法实现:


希尔排序时效分析较难,比较次数与记录移动次数依赖于增量因子序列 gap 的选取,特定情况下可以准确估算出关键码的比较次数和记录的移动次数。是一个不稳定的排序方法。

Selection sort 选择排序

在要排序的一组数中,选出最小(或者最大)的一个数与第1个位置的数交换;然后在剩下的数当中再找最小 (或者最大) 的与第2个位置的数交换,依次类推,直到第n-1个元素(倒数第二个数) 和第n个元素(最后一个数)比较为止。


操作方法:

第一轮,从n个记录中找出关键码最小的记录与第一个记录交换;

第二轮,从第二个记录开始的n-1个记录中再选出关键码最小的记录与第二个记录交换;

第i 轮,从第i 个记录开始的 n-i+1个记录中选出关键码最小的记录与第i 个记录交换;

直到整个序列按关键码有序。

C++算法实现:


Python算法实现:



Heap sort 堆排序

堆排序是一种树形选择排序,是对直接选择排序的有效改进。

堆的定义:具有n个元素的序列(k1,k2,...,kn),当且仅当满足


时称之为堆。

若以一维数组存储一个堆,则堆对应一棵完全二叉树,且所有非叶结点的值均不大于(或不小于)其子女的值,根结点(堆顶元素)的值是最小(或最大)的。如:

(a) 大顶堆序列:(96,83,27,38,11,09)

(b) 小顶堆序列:(12,36,24,85,47,30,53,91)


初始时把要排序的n个数的序列看作是一棵顺序存储的二叉树(一维数组存储二叉树),调整它们的存储序,使之成为一个堆,将堆顶元素输出,得到n个元素中最小(或最大)的元素,这时堆的根节点的数最小(或者最大)。然后对前面(n-1)个元素重新调整使之成为堆,输出堆顶元素,得到n个元素中次小(或此大)的元素。依次类推,直到只有两个节点的堆,并对它们作交换,最后得到有n个节点的有序序列。这个过程为堆排序。

因此,实现堆排序需要解决两个问题:

1. 如何将n个待排序的数建成堆;

2. 输出堆顶元素后,怎样调整剩余n-1个元素,使其成为一个新堆。

输出堆顶元素后,对剩余n-1个元素重新建成堆的调整过程。

调整小顶堆的方法:

1)设有m个元素的堆,输出堆顶元素后,剩下m-1个元素。将堆底元素送入堆顶(最后一个元素与堆顶进行交换),堆被破坏,其原因仅是根结点不满足堆的性质。

2)将根结点与左,右子树中较小元素的进行交换。

3)若与左子树交换:如果左子树堆被破坏,即左子树的根结点不满足堆的性质,则重复方法(2)。

4)若与右子树交换,如果右子树堆被破坏,即右子树的根结点不满足堆的性质,则重复方法(2)。

5)继续对不满足堆性质的子树进行上述交换操作,直到叶子结点,堆被建成。

称这个自根结点到叶子结点的调整过程为筛选。


对n个元素初始建堆的过程。

建堆方法:对初始序列建堆的过程,就是一个反复进行筛选的过程。

1)n个结点的完全二叉树,则最后一个结点是第[n/2] 个结点的子树。

2)筛选从第[n/2]个结点为根的子树开始,该子树成为堆。

3)  之后向前依次对各结点为根的子树进行筛选,使之成为堆,直到根结点。

如图建堆初始过程:无序序列:(49, 38, 65, 97,76, 13, 27, 49)


算法实现:从算法描述来看,堆排序需要两个过程,一是建立堆,二是堆顶与堆的最后一个元素交换位置。所以堆排序有两个函数组成。一是建堆的渗透函数,二是反复调用渗透函数实现排序的函数。


C++算法实现:


Python 算法实现:


设树的深度为k,k=[log2n]+1,从根到叶的筛选,元素比较次数至多2(k-1)次,交换记录至多k次。所以,在建好堆后,排序过程中的筛选次数不超过下式:


而建堆时的比较次数不超过4n次,因此堆排序最坏情况下,时间复杂度也为:O(nlogn)。

Bubble sort 冒泡排序

在要排序的一组数中,对当前还未排好序的范围内的全部数,自上而下对相邻的两个数依次进行比较和调整,让较大的数往下沉,较小的往上冒。即:每当两相邻的数比较后发现它们的排序与排序要求相反时,就将它们互换。

C++算法实现:


Python算法实现:


Quick sort 快速排序

基本思想:

1)选择一个基准元素,通常选择第一个元素或者最后一个元素

2)通过一趟排序讲待排序的记录分割成独立的两部分,其中一部分记录的元素值均比基准元素值小。另一部分记录的元素值比基准值大。

3)此时基准元素在其排好序后的正确位置

4)然后分别对这两部分记录用同样的方法继续进行排序,直到整个序列有序。

排序过程:


C++算法实现:


Python算法实现:


快速排序通常被认为在同数量级 (O(nlog2n))的排序方法中平均性能最好。快速排序是一个不稳定的排序方法。

Merge sort 归并排序

归并排序法是将两个(或两个以上) 有序表合并成一个新的有序表,即把待排序序列分为若干个子序列,每个子序列是有序的。然后再把有序子序列合并为整体有序序列。


合并方法:

设r[i...n]由两个有序子表r[i,...m]和r[m+1...n]组成,两个子表长度分别为m-i+1和n-m。

1. j=m+1; k=i; i=i; //置两个子表的起始下标及辅助数组的起始下标

2. 若i>m 或 j>n,转(4) //其中一个子表已合并完,比较选取结束

3. //选取r[i]和r[j] 较小的存入辅助数组rf

    如果r[i]<r[j],rf[k]=r[i]; i++; k++; 转(2)

    否则,rf[k]=r[j];j++; k++;转(2)

4,//将尚未处理完的子表中元素存入rf

    如果i<=m,将r[i...m]存入rf[k...n] //前一子表非空

    如果j<=n,将r[j...n]存入rf[k...n] //后一子表非空

5. 合并结束

1个元素的表总是有序的。所以对n个元素的待排序列,每个元素可以看成1个有序子表。对子表两两合并生成n/2个子表,所得子表除最后一个子表长度可能为1外,其余子表长度均为2。再进行两两合并,直到生成n个元素按关键码有序的表。

C++ 算法实现:


Python 算法实现:


归并排序算法中,在合并两个已排序的表时,通常的做法时新建一个大小等于它们之和的新表,用于存储这两个表合并的结果,然后把合并后的表在拷贝回这两个连续的表中。另外一个做法,也可以不分配新的空间存储结果,而是使用插入排序的思想进行合并。

使用分配空间合并的方式,时间复杂度为O(nlogn),使用插入合并方式,时间复杂度为 O(n^2)。


Radix sort 基数排序

是按照低位先排序,然后收集;再按照高位排序,然后再收集;依次类推,直到最高位。有时候有些属性是有优先级顺序的,先按低优先级排序,再按高优先级排序。最后的次序就是高优先级高的在前,高优先级相同的低优先级高的在前。基数排序基于分别排序,分别收集,所以是稳定的。


C++算法实现:




算法时间复杂度计算:

1. 计算出基本操作的执行次数 T(n)

基本操作即算法中的每条语句(以;为分割),语句的执行次数也叫做语句的频度。在做算法分析时,一般默认为考虑最坏的情况。

2. 计算出T(n) 的数量级

求T(n) 的数量级,只要将T(n) 进行如下操作:

忽略常量,低次幂和最高次幂的系数,令 f(n)=T(n)的数量级。

3. 用大O来表示时间复杂度

当n趋近无穷大时,如果lim(T(n)/f(n))的值为不等于0的常数,则称f(n)是T(n)的同数量级函数。记作 T(n)=O(f(n))。


简化步骤:

1. 找到执行次数最多的语句

2. 计算语句执行次数的数量级

3. 用大O来表示结果


复杂度为 c, log2n, n, n*log2n, 这个算法时间效率比较高,如果是 2n, 3n, n! 会很差。





  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值