python算法与数据结构——排序

最新推荐文章于 2024-08-02 22:01:50 发布

1129的阳光

最新推荐文章于 2024-08-02 22:01:50 发布

阅读量133

点赞数

本文链接：https://blog.csdn.net/hyq666888999/article/details/86605658

版权

排序算法的稳定性

举个简单的例子：
有这样一个乱序数列【４,５,９,３,６,７，４,８,７,５,６,４，２,１】
这个数列中，４出现过三次，分别是在【０,６,１１】号位置，，我们不妨给这三个４分别命名，（４,０），（４,６），（４,１１）排序算法有很多种，见下文。如果数列经过排序后原来的三个４相对位置不变，仍旧是（４,０），（４,６），（４,１１）那么就称这种排序算法稳定，反之没如果三个４的相对位置发生改变，比如，（４,６）（４,０），（４,１１），那么这种排序算法就不稳定。

冒泡排序

冒泡排序是最简单的排序算法，最符合认为排序的思维，
　　冒泡排序的原理见下图：一组乱序数列【54，26，93，17，77，31，44，55，20】，这里排序算法的目标是将数列从小到大排序。具体过程为，假设有一个游标，指向第一个数字，接下来比较第一个数字与第二个数字的大小，如果后者大于前者，游标指向后者，否则将两个数字互换位置，此时，54位于第二个位置，游标仍旧指向54，然后对比54与第三个数字93的大小，93大于54，则游标指向93，再去比较93与第四个数字的大小．．．．．．直到将整个数列中的最大的数字放到最后一个位置，第一次循环结束，接下来重复第二轮循环，将第二大的数字放到导数第二个位置。，一次类推，可以逐步将大数字放到最后。
在这里插入图片描述
经过以上分析可知，如果有n个数字，那么最坏的情况，需要n-1次循环，第一次循环需要做n-1次大小判断，最后一次需要做一次大小判断。　
　　内层循环：两个相邻的数字对比交换
算法优化：如果拍到某个阶段，发现某次循环过程中，没有发生元素位置的交换，说明此事的数列已经是按照从小到大的顺序排列的，这种情况可以退出循环。
　　最优时间复杂度：Ｏ（ｎ）
　　最坏时间复杂度：Ｏ（ｎ²）
　　稳定性：稳定

def bubble_sort(alist):
    '''优化后的冒泡排序'''
    '''最优的情况是数列中的数字按照从小到大的顺序排列，那么在循环的过程中不会发生交换的情况'''
    n=len(alist)
    for j in range(1,n):
        #for j in range(1,n)这样写存在多于的情况
        count=0
        for i in range(0,n-j):
            if alist[i]>alist[i+1]:
                alist[i+1],alist[i]=alist[i],alist[i+1]
                count+=1
        if count==0:
            return

选择排序

选择排序的原理：
第一次，从乱序数列中找到最小的数字，将其与第一个数字互换，第二次，从第二个数字开始的数列中找到第二小的数字，与第二个数字互换.．．．．．．也就是说，每次循环都从乱序数列中找到最小的数字，放置于前面，前面是有序数列，后面是乱序数列。
时间复杂度，根据外层循环的次数和内层循环的次数相乘Ｏ（ｎ²），最坏时间复杂度与最优十家复杂度相同，
稳定性：如果考虑升序选择最小值，稳定，若选择最大值，则不稳定

def select_sort(alist):
    n=len(alist)
    for i in range(n-1):
        nmin=alist[i]
        for j in range(i+1,n):
            if nmin>alist[j]:
                nmin,alist[j]=alist[j],nmin
        alist[i]=nmin

插入排序

插入排序的原理是，首先，将数列中的第一个数字当成有序数列，后面的认为是无序数列，比较后面数列中的第一个元素与有序数列比较，从前面数列的最后一个数开始比较逐渐向前，最终将该数字放到前面数列中的正确位置，此时前面两个数字为有序数列，接着，再次取出后面数列中的第一个数字，与前面的数字比较，插入正确位置。

快速排序

1、采用两个游标，一个小数游标（low），一个大数游标（high）
先挑出第一个数（记为N），剩下的乱序元素，low指向第一个，high指向最后一个，先让low向后移，当low遇到一个比N大的数字A1，low停下，让high向前移，直到high遇到一个比N小的数字A2，此时，将A1与A2交换位置，则low继续向后移，并重复之前的操作，直至low与high重合，此时low与high所指的数字大于N，前一位的数字小于N，那么N正确的位置应给是重合游标前一位。
此时，所有在N左边的数字都小于N，而N右边的数字都大于N。
当找出第一个数字的位置后，N之前的数字和N之后的数字均是乱序的，对剩下的两组数据再次执行上一步的操作，

而具体的算法过程，有另一种便于写代码的思维：
同样是low指向第一个数字，high指向最后一个数字，　　然后，将第一个数字取出赋给mid_value，则此时low不动，　　接着，判断high所指的数字与mid_value的大小，如果小于mid_value，则将high值赋给low值，此时high指向空。low继续向后移动，　　当low所指的数字大于mid_value，则将low值赋给high值，则此时，low指向空，high继续向前移动　　直到high值再次小于mid_value，再次将high赋给low，low继续向后移动……直到两者重合，此时两者所指向的是一个空则只需要让该位置的值等于mid_value即可。

注意：这里所说的游标指向为空，在实际中并不是真的空，而是说，这里的数字因为在不正确的位置，已经将该数字复制到了一个正确的位置，那么该位置上的数字就是多余的，只是占着空间，最终是要被其他数字替代的。

剩下的两个乱序数列重复之前的操作

算法过程：
分成两个并列循环：
①　如果low与high不重合（low<high），并且high所指的数值大于mid_value，一直执行high向左移，退出循环之后的操作是，将high所指的数值赋给low所指的。并且让low向右移动一个位置。
②　如果low小于high，并且low所指的数值不大于mid_value，一直执行low向右移，退出循环的操作是

考虑到排序的，如果数列中有重复数字，那么最好把与mid_value相等的数字放在high的部分。虽然也可以两边都放或者放在左边，放在一边更方便，且放在右边
无论哪种方法，快速排序都不稳定

def quick_sort(alist,first,last):
    if first>=last: #当送进来的数列只有一个数字时，结束递归
    #关于大于等于号和等于号的讨论，如果是等于号，比如[1,2]这样的数组，first=0，last=1，满足first小于last执行排序，第一次执行后low=high=0,last=0,注意接下来开始递归，一个是quick_sort(alist,first,low-1) ，这里first等于0，而low-1=-1，满足二者不相等如果最初的判断条件是二者相等，就会出错，因此必须保证first小于last 
    
        return
    mid_value=alist[first]    
    low=first
    high=last
    while low<high:
        while low<high and alist[high]>=mid_value:
            high-=1
        alist[low]=alist[high]
        #low+=1
        while low<high and alist[low]<mid_value:
            low+=1
        alist[high]=alist[low]
        #high-=1
    alist[low]=mid_value    
    quick_sort(alist,first,low-1)
    quick_sort(alist,low+1,last)

最优时间复杂度：O(nlog(n))
最坏时间复杂度：O（n²）

归并排序

先将一组数分成差不多相等的两部分，再对子数列执行同样操作，直到所有小组都分成单个的，然后两两先排序然后合并，再利用游标，将两对数字排序合并……
在这里插入图片描述
与快排不同，这里不是每次对自身进行操作，而是将切片取出来，对切片进行操作，之后返回有序的数组。
时间复杂度分析：
　　根据代码分析，送进去的数列首先进行主次拆分，没有循环，这个过程的时间复杂度为O（1）？与n无关？
最坏和最优的时间复杂度都是O（nlog(n)）
稳定性：稳定（前提是代码中当两个数字相等时，把左边的数字追加到列表中）
空间：由于开辟了新的空间，因此空间成本高
在这里插入图片描述
　　注意：在面试的时候，至少要掌握两三种常用的排序算法，而必须要掌握的是快速排序