Python练手之6种经典排序算法

最新推荐文章于 2024-04-22 16:07:30 发布

一枪尽骚丶魂

最新推荐文章于 2024-04-22 16:07:30 发布

阅读量1.7k

点赞数

分类专栏： Python 文章标签： python

Python 专栏收录该内容

30 篇文章 0 订阅

订阅专栏

在入手了python之后，确实被它简单的特性和上手容易度震惊过。不过python和c语言什么的又确实存在很大的差别，习惯了c语言，使用python的时候多少还是有些不习惯。

入手python一周左右了，为了熟悉和深化对python的理解，就把几种经典的排序算法拿来练手，顺便强化一下自己的基础知识。开始写了，才发现自己写出来的代码问题还真不少，排序的结果总是有各种问题，看来真的是很久没有用这些算法写过东西了，都忘了一些细节的东西了，汗哪。。。

废话不多说，开始练手吧。

排序前需要给定一个数据集，这个用随机数生成就好：

[python]view plaincopy 
   
 #-*- coding: utf-8 -*-  
 #!/usr/bin/python  
 #Filename:randata.py  
 #Author: Boyce  
 #Email:  boyce.ywr@gmail.com  
 import random  
 ''''' 
 随机生成0~10000000之间的数值 
 '''  
 def getrandata(num):  
     a=[]  
     i=0  
     while i<num:  
         a.append(random.randint(0,10000000))  
         i+=1  
     return a  

经典算法之冒泡排序（Bubble sort）：

[python]view plaincopy 
   
 #-*- coding: utf-8 -*-  
 #!/usr/bin/python  
 #Filename:bubble_sort.py  
 #Author: Boyce  
 #Email:  boyce.ywr@gmail.com  
 import randata  
 ''''' 
 算法思想：每次从最后开始往前滚，邻接元素两两相比，小元素交换到前面 
 第一轮循环把最小的元素上浮至第一个位置，第二小的元素上浮至第二个位置，依次类推 
 '''  
 def bubbleSort(a):  
     l=len(a)-2  
     i=0  
     while i<l:  
         j=l  
         while j>=i:  
             if(a[j+1]<a[j]):  
                 a[j],a[j+1]=a[j+1],a[j]  
             j-=1  
         i+=1  

经典算法之直接插入排序（Insert sort）：

[python]view plaincopy 
   
 #-*- coding: utf-8 -*-  
 #!/usr/bin/python  
 #Filename: insert_sort.py  
 #Author: Boyce  
 #Email:  boyce.ywr@gmail.com  
 import randata  
 ''''' 
 被注释掉的部分是c语言数组普通的插入方式 
 未被注释的部分则是使用python列表的插入和删除特性改善的 
 '''  
 def insertSort(arr):  
     for i in range(1,len(arr)):  
         ''''' 
         tmp=arr[i] 
         j=i 
         while j>0 and tmp<arr[j-1]: 
             arr[j]=arr[j-1] 
             j-=1 
         arr[j]=tmp 
         '''  
         j=i  
         while j>0 and arr[j-1]>arr[i]:  
             j-=1  
         arr.insert(j,arr[i])  
         arr.pop(i+1)  

经典算法之希尔排序（Shell sort）：

[python]view plaincopy 
   
 #-*- coding: utf-8 -*-  
 #!/usr/bin/python  
 #Filename: shell_sort.py  
 #Author: Boyce  
 #Email:  boyce.ywr@gmail.com  
 import randata  
 def shellSort(arr):  
     dist=len(arr)/2  
     while dist>0:  
         for i in range(dist,len(arr)):  
             tmp=arr[i]  
             j=i  
             while j>=dist and tmp<arr[j-dist]:  
                 arr[j]=arr[j-dist]  
                 j-=dist  
             arr[j]=tmp  
         dist/=2  

希尔排序的名称源于它的发明者Donald Shell，该算法是冲破二次时间屏障的第一批算法之一，不过，直到它最初被发现的若干年后才被证明了它的亚二次时间界。它通过比较相距一定间隔的元素来工作；各趟比较所用的距离随着算法的进行而减小，直到只比较相邻元素的最后一趟排序为止。

经典算法之归并排序（Merge sort）：

[python]view plaincopy 
   
 #-*- coding: utf-8 -*-  
 #!/usr/bin/python  
 #Filename: merge_sort.py  
 #Author: Boyce  
 #Email:  boyce.ywr@gmail.com  
 import randata  
 ''''' 
 使用新分配的空间存储合并得到的新列表 
 arr：  原始列表（数组） 
 s：    需合并的第一段空间起始点 
 m：    需合并的第二段空间起始点 
 e：    需合并的第二段空间结束点 
 '''  
 def mergeWithNewSpace(arr,s,m,e):  
     i,j=s,m  
     t=0  
     newArr=[]  
     while i<m and j<=e:  
         if(arr[i]<arr[j]):  
             newArr.append(arr[i])  
             i+=1  
             t+=1  
         else:  
             newArr.append(arr[j])  
             j+=1  
             t+=1  
     if i>=m:  
         t=0  
         for i in range(s,j):  
             arr[i]=newArr[t]  
             t+=1  
     else:  
         t=0  
         for i in range(i,m):  
             newArr.append(arr[i])  
         for i in range(s,e+1):  
             arr[i]=newArr[t]  
             t+=1  
     del newArr  
 def mergePassWithNewSpace(arr, n, d):  
     i=0  
     while i<(n-d) and i<(n+1-2*d):  
         mergeWithNewSpace(arr,i,i+d,i+2*d-1)  
         i=i+2*d  
     if i<n-d:  
         mergeWithNewSpace(arr,i,i+d,n-1)  
     else:  
         mergeWithNewSpace(arr,i-2*d,i,n-1)  
 def mergeSortWithNewSpace(arr):  
     d=1  
     while d<len(arr):  
         mergePassWithNewSpace(arr,len(arr),d)  
         d*=2  
 ''''' 
 不分配新的空间存储合并得到的列表 
 而是使用原列表使用插入方式存储 
 arr：  原始列表（数组） 
 s：    需合并的第一段空间起始点 
 m：    需合并的第二段空间起始点 
 e：    需合并的第二段空间结束点 
 被注释掉的部分是c语言数组普通的插入方式 
 未被注释的部分则是使用python列表的插入和删除特性改善的 
 '''  
 def mergeWithoutNewSpace(arr,s,m,e):  
     i,j=s,m  
     while i<m and j<=e:  
         if arr[i]>arr[j]:  
             ''''' 
             tmp=arr[j] 
             k=j 
             while k>i: 
                 arr[k]=arr[k-1] 
                 k-=1 
             arr[i]=tmp 
             '''  
             arr.insert(i,arr[j])  
             arr.pop(j+1)  
             j+=1  
             m+=1  
         else:  
             i+=1  
 ''''' 
 arr：  原始列表（数组） 
 n：    数组大小 
 d：    区间大小 
 '''  
 def mergePassWithoutNewSpace(arr, n, d):  
     i=0  
     while i<(n-d) and i<(n+1-2*d):  
         mergeWithoutNewSpace(arr,i,i+d,i+2*d-1)  
         i=i+2*d  
     if i<n-d:  
         mergeWithoutNewSpace(arr,i,i+d,n-1)  
     else:  
         mergeWithoutNewSpace(arr,i-2*d,i,n-1)  
 def mergeSortWithoutNewSpace(arr):  
     d=1  
     while d<len(arr):  
         mergePassWithoutNewSpace(arr,len(arr),d)  
         d*=2  

归并排序算法中，在合并两个已排序的表时，通常的做法是新建一个大小等于它们之和的新表，用于存储这两个表合并的结果，然后把把合并后的表在拷贝回这两个连续的表中。另外一个做法，也可以不分配新的空间存储结果，而是使用插入排序的思想进行合并。

使用分配空间合并的方式，时间复杂度为O(nlogn)，使用插入合并的方式，时间复杂度为O(n^2)，这里采用python列表的插入和删除机制，比c语言中数组整体往后挪动的插入方式（见注释部分）要高效不少。

经典算法之堆排序：

[python] view plaincopy 
   
 #-*- coding: utf-8 -*-  
 #!/usr/bin/python  
 #Filename:heap_sort.py  
 #Author: Boyce  
 #Email:  boyce.ywr@gmail.com  
 ''''' 
 大根堆：在一棵完全二叉树中，对于任意节点，满足性质arr[i]>=arr[2*i], arr[i]>=arr[2*i+1] 
 小根堆：在一棵完全二叉树中，对于任意节点，满足性质arr[i]<=arr[2*i], arr[i]<=arr[2*i+1] 
 '''  
 import randata  
 ''''' 
 假定除了start位置的顶点外，以start位置为root的这棵二叉树是一个大根堆 
 向下调整start位置的节点至合适的位置，是的这棵树重新恢复为一个大根堆 
 '''  
 def adjust(arr,start,size):  
     tmp=arr[start]  
     j=2*start+1  
     while j<size:  
         if j<size-1 and arr[j]<arr[j+1]:  
             j+=1  
         if tmp>=arr[j]:  
             break  
         arr[start]=arr[j]  
         start=j  
         j=2*j+1  
     arr[start]=tmp  
 ''''' 
 从一堆乱序的元素列表中建立大根堆 
 '''  
 def buildHeap(arr):  
     size=len(arr)  
     for i in range(size/2-1,-1,-1):  
         adjust(arr,i,size)  
 def heapSort(arr):  
     size=len(arr)  
     buildHeap(arr)  
     ''''' 
     建立大根堆后，第一个元素为列表的最大元素，将它跟最后一个元素交换，列表大小-1 
     重新调整列表为大根堆，重复此操作直到最后一个元素 
     '''  
     for i in range(size-1,0,-1):  
         arr[i],arr[0]=arr[0],arr[i]  
         adjust(arr,0,i)  

堆排序的思路是建立在大根堆和小根堆的基础上，具体步骤可以参见网上解释以及上面的源码。

经典算法之快速排序：

[python]view plaincopy 
   
 #-*- coding: utf-8 -*-  
 #!/usr/bin/python  
 #Filename:quick_sort.py  
 #Author: Boyce  
 #Email:  boyce.ywr@gmail.com  
 import randata  
 import sys  
 ''''' 
 这个函数的作用是，从区间的第一个，最后一个和最中间的位置上选出一个中间大小的值，并把它放置在区间的第一个位置上 
 这样有效消除预排序的最坏情况 
 '''  
 def median(a,start,end):  
     center=(start+end)/2  
     if a[start]>a[center]:  
         a[start],a[center]=a[center],a[start]  
     if a[start]>a[end]:  
         a[start],a[end]=a[end],a[start]  
     if a[center]>a[end]:  
         a[center],a[end]=a[end],a[center]  
     a[start],a[center]=a[center],a[start]  
 def doSwap(a,start,end):  
     if start>=end:  
         return  
     i,j=start,end  
     median(a,start,end)  
     tmp=a[start]  
     while(True):  
         while(a[j]>tmp and i<j):  
             j-=1  
         if i<j:  
             a[i]=a[j]  
             i+=1  
         while(a[i]<tmp and i<j):  
             i+=1  
         if i<j:  
             a[j]=a[i]  
             j-=1  
         else:  
             break  
     a[i]=tmp  
     doSwap(a,start,i-1)  
     doSwap(a,j+1,end)  
 def quickSort(a):  
     #设置递归深度为10000000，放置数据量过大时超出递归最大深度发生exception  
     sys.setrecursionlimit(1000000)  
     doSwap(a,0,len(a)-1)  

在这里，快速排序算法在选择参考值的时候，采用了中值选取的方式，即从区间的第一个，最后一个和最中间的元素，这三个中选择一个中间大小的作为参考值，把这个元素挪动至第一个位置。这个算法可以有效消除快速排序中的最坏时间复杂度。

写出了算法，总要有个东西来验证，写一个单独的部分来执行这些算法，输出个算法花费的时间值，并将他们的执行结果输出至文件中，用于检验执行结果是否正确。

[python]view plaincopy 
   
 #-*- coding: utf-8 -*-  
 #!/usr/bin/python  
 #Filename:sort.py  
 #Author: Boyce  
 #Email:  boyce.ywr@gmail.com  
 import time  
 import randata  
 import bubble_sort  
 import quick_sort  
 import heap_sort  
 import shell_sort  
 import merge_sort  
 import insert_sort  
 fileName='sort.dat'  
 size=10000  
 print '/nStart generate randam data...'  
 arr=randata.getrandata(size)  
 print 'Data generation finished.'  
 print 'Data size is %d, result will be save to file %s'%(size,fileName)  
 f=file(fileName,'w')  
 f.write("/nOriginal data:/n")  
 f.write(str(arr))  
 #使用python内置的timSort排序算法  
 a=arr[:]  
 print '/nStart internal sort...'  
 t1=time.clock()  
 a.sort()  
 t2=time.clock()  
 print 'Internal sort finisehd. Time used=%fs'%(t2-t1)  
 f.write('/n/nInternal sort [Time used=%fs]/n'%(t2-t1))  
 f.write(str(a))  
 del a  
 a=arr[:]  
 print '/nStart quick sort...'  
 t1=time.clock()  
 quick_sort.quickSort(a)  
 t2=time.clock()  
 print 'Quick sort finished. Time used=%fs'%(t2-t1)  
 f.write('/n/nQuick sort [Time used=%fs]/n'%(t2-t1))  
 f.write(str(a))  
 del a  
 a=arr[:]  
 print '/nStart heap sort...'  
 t1=time.clock()  
 heap_sort.heapSort(a)  
 t2=time.clock()  
 print 'Heap sort finished. Time used=%fs'%(t2-t1)  
 f.write('/n/nHeap sort [Time used=%fs]/n'%(t2-t1))  
 f.write(str(a))  
 del a  
 a=arr[:]  
 print '/nStart shell sort...'  
 t1=time.clock()  
 shell_sort.shellSort(a)  
 t2=time.clock()  
 print 'Shell sort finished. Time used=%fs'%(t2-t1)  
 f.write('/n/nShell sort [Time used=%fs]/n'%(t2-t1))  
 f.write(str(a))  
 del a  
 a=arr[:]  
 print '/nStart merge sort with new space...'  
 t1=time.clock()  
 merge_sort.mergeSortWithNewSpace(a)  
 t2=time.clock()  
 print 'Merge sort with new space finished. Time used=%fs'%(t2-t1)  
 f.write('/n/nMerge sort with new space [Time used=%fs]/n'%(t2-t1))  
 f.write(str(a))  
 del a  
 a=arr[:]  
 print '/nStart merge sort without new space...'  
 t1=time.clock()  
 merge_sort.mergeSortWithoutNewSpace(a)  
 t2=time.clock()  
 print 'Merge sort without new space finished. Time used=%fs'%(t2-t1)  
 f.write('/n/nMerge sort without new space [Time used=%fs]/n'%(t2-t1))  
 f.write(str(a))  
 del a  
 a=arr[:]  
 print '/nStart insert sort...'  
 t1=time.clock()  
 insert_sort.insertSort(a)  
 t2=time.clock()  
 print 'Insert sort finished. Time used=%fs'%(t2-t1)  
 f.write('/n/nInsert sort [Time used=%fs]/n'%(t2-t1))  
 f.write(str(a))  
 del a  
 a=arr[:]  
 print '/nStart bubble sort...'  
 t1=time.clock()  
 bubble_sort.bubbleSort(a)  
 t2=time.clock()  
 print 'Bubble sort finished. Time used=%fs'%(t2-t1)  
 f.write('/n/nBubble sort [Time used=%fs]/n'%(t2-t1))  
 f.write(str(a))  
 del a  
 f.close()  

这是某次执行的结果：

输出结果被保存在当前目录的sort.dat文件中，用记事本打开即可看到。

（看看人家python内置的timSort排序算法，根本就不是一个数量级的，真牛，好快呀。。。）

这就是输出文件的内容显示：

一枪尽骚丶魂

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Python练手之6种经典排序算法

在入手了python之后，确实被它简单的特性和上手容易度震惊过。不过python和c语言什么的又确实存在很大的差别，习惯了c语言，使用python的时候多少还是有些不习惯。入手python一周左右了，为了熟悉和深化对python的理解，就把几种经典的排序算法拿来练手，顺便强化一下自己的基础知识。开始写了，才发现自己写出来的代码问题还真不少，排序的结果总是有各种问题，看来真的是很久没有用
复制链接

扫一扫