排序算法的稳定性
举个简单的例子:
有这样一个乱序数列【4,5,9,3,6,7,4,8,7,5,6,4,2,1】
这个数列中,4出现过三次,分别是在【0,6,11】号位置,,我们不妨给这三个4分别命名,(4,0),(4,6),(4,11)排序算法有很多种,见下文。如果数列经过排序后原来的三个4相对位置不变,仍旧是(4,0),(4,6),(4,11)那么就称这种排序算法稳定,反之没如果三个4的相对位置发生改变,比如,(4,6)(4,0),(4,11),那么这种排序算法就不稳定。
冒泡排序
冒泡排序是最简单的排序算法,最符合认为排序的思维,
冒泡排序的原理见下图:一组乱序数列【54,26,93,17,77,31,44,55,20】,这里排序算法的目标是将数列从小到大排序。具体过程为,假设有一个游标,指向第一个数字,接下来比较第一个数字与第二个数字的大小,如果后者大于前者,游标指向后者,否则将两个数字互换位置,此时,54位于第二个位置,游标仍旧指向54,然后对比54与第三个数字93的大小,93大于54,则游标指向93,再去比较93与第四个数字的大小......直到将整个数列中的最大的数字放到最后一个位置,第一次循环结束,接下来重复第二轮循环,将第二大的数字放到导数第二个位置。,一次类推,可以逐步将大数字放到最后。
经过以上分析可知,如果有n个数字,那么最坏的情况,需要n-1次循环,第一次循环需要做n-1次大小判断,最后一次需要做一次大小判断。
内层循环:两个相邻的数字对比交换
算法优化:如果拍到某个阶段,发现某次循环过程中,没有发生元素位置的交换,说明此事的数列已经是按照从小到大的顺序排列的,这种情况可以退出循环。
最优时间复杂度:O(n)
最坏时间复杂度:O(n2)
稳定性:稳定
def bubble_sort(alist):
'''优化后的冒泡排序'''
'''最优的情况是数列中的数字按照从小到大的顺序排列,那么在循环的过程中不会发生交换的情况'''
n=len(alist)
for j in range(1,n):
#for j in range(1,n)这样写存在多于的情况
count=0
for i in range(0,n-j):
if alist[i]>alist[i+1]:
alist[i+1],alist[i]=alist[i],alist[i+1]
count+=1
if count==0:
return
选择排序
选择排序的原理:
第一次,从乱序数列中找到最小的数字,将其与第一个数字互换,第二次,从第二个数字开始的数列中找到第二小的数字,与第二个数字互换.......也就是说,每次循环都从乱序数列中找到最小的数字,放置于前面,前面是有序数列,后面是乱序数列。
时间复杂度,根据外层循环的次数和内层循环的次数相乘O(n2),最坏时间复杂度与最优十家复杂度相同,
稳定性:如果考虑升序选择最小值,稳定,若选择最大值,则不稳定
def select_sort(alist):
n=len(alist)
for i in range(n-1):
nmin=alist[i]
for j in range(i+1,n):
if nmin>alist[j]:
nmin,alist[j]=alist[j],nmin
alist[i]=nmin
插入排序
插入排序的原理是,首先,将数列中的第一个数字当成有序数列,后面的认为是无序数列,比较后面数列中的第一个元素与有序数列比较,从前面数列的最后一个数开始比较逐渐向前,最终将该数字放到前面数列中的正确位置,此时前面两个数字为有序数列,接着,再次取出后面数列中的第一个数字,与前面的数字比较,插入正确位置。
快速排序
1、采用两个游标,一个小数游标(low),一个大数游标(high)
先挑出第一个数(记为N),剩下的乱序元素,low指向第一个,high指向最后一个,先让low向后移,当low遇到一个比N大的数字A1,low停下,让high向前移,直到high遇到一个比N小的数字A2,此时,将A1与A2交换位置,则low继续向后移, 并重复之前的操作,直至low与high重合,此时low与high所指的数字大于N,前一位的数字小于N,那么N正确的位置应给是重合游标前一位。
此时,所有在N左边的数字都小于N,而N右边的数字都大于N。
当找出第一个数字的位置后,N之前的数字和N之后的数字均是乱序的,对剩下的两组数据再次执行上一步的操作,
而具体的算法过程,有另一种便于写代码的思维:
同样是low指向第一个数字,high指向最后一个数字, 然后,将第一个数字取出赋给mid_value,则此时low不动, 接着,判断high所指的数字与mid_value的大小,如果小于mid_value,则将high值赋给low值,此时high指向空。low继续向后移动, 当low所指的数字大于mid_value,则将low值赋给high值,则此时,low指向空,high继续向前移动 直到high值再次小于mid_value,再次将high赋给low,low继续向后移动……直到两者重合,此时两者所指向的是一个空则只需要让该位置的值等于mid_value即可。
注意:这里所说的游标指向为空,在实际中并不是真的空,而是说,这里的数字因为在不正确的位置,已经将该数字复制到了一个正确的位置,那么该位置上的数字就是多余的,只是占着空间,最终是要被其他数字替代的。
剩下的两个乱序数列重复之前的操作
算法过程:
分成两个并列循环:
① 如果low与high不重合(low<high),并且high所指的数值大于mid_value,一直执行high向左移,退出循环之后的操作是,将high所指的数值赋给low所指的。并且让low向右移动一个位置。
② 如果low小于high,并且low所指的数值不大于mid_value,一直执行low向右移,退出循环的操作是
考虑到排序的,如果数列中有重复数字,那么最好把与mid_value相等的数字放在high的部分。虽然也可以两边都放或者放在左边,放在一边更方便,且放在右边
无论哪种方法,快速排序都不稳定
def quick_sort(alist,first,last):
if first>=last: #当送进来的数列只有一个数字时,结束递归
#关于大于等于号和等于号的讨论,如果是等于号,比如[1,2]这样的数组,first=0,last=1,满足first小于last执行排序,第一次执行后low=high=0,last=0,注意接下来开始递归,一个是quick_sort(alist,first,low-1) ,这里first等于0,而low-1=-1,满足二者不相等如果最初的判断条件是二者相等,就会出错,因此必须保证first小于last
return
mid_value=alist[first]
low=first
high=last
while low<high:
while low<high and alist[high]>=mid_value:
high-=1
alist[low]=alist[high]
#low+=1
while low<high and alist[low]<mid_value:
low+=1
alist[high]=alist[low]
#high-=1
alist[low]=mid_value
quick_sort(alist,first,low-1)
quick_sort(alist,low+1,last)
最优时间复杂度:O(nlog(n))
最坏时间复杂度:O(n2)
归并排序
先将一组数分成差不多相等的两部分,再对子数列执行同样操作,直到所有小组都分成单个的,然后两两先排序然后合并,再利用游标,将两对数字排序合并……
与快排不同,这里不是每次对自身进行操作,而是将切片取出来,对切片进行操作,之后返回有序的数组。
时间复杂度分析:
根据代码分析,送进去的数列首先进行主次拆分,没有循环,这个过程的时间复杂度为O(1)?与n无关?
最坏和最优的时间复杂度都是O(nlog(n))
稳定性:稳定(前提是代码中当两个数字相等时,把左边的数字追加到列表中)
空间:由于开辟了新的空间,因此空间成本高
注意:在面试的时候,至少要掌握两三种常用的排序算法,而必须要掌握的是快速排序