一、归并排序
本节讨论分治策略在排序中的应用。
归并排序是递归算法,思路是将数据表持续分裂为两半,对两半分别进行归并排序。
递归的基本结束条件是:数据项仅有一个数据项,自然是排好序的。
缩小规模:将数据分裂为相等的两半,规模减为原来的二分之一;
调用自身:将两半分别调用自身排序,然后将分别排好序的两半进行归并,得到排好序的数据表。
代码:
def merge_sort(lst):
if len(lst) <= 1:
return lst
middle = len(lst) // 2
left = merge_sort(lst[:middle])
right = merge_sort(lst[middle:])
merged = []
while left and right:
if left[0] <= right[0]:
merged.append(left.pop(0))
else:
merged.append(right.pop(0))
merged.extend(right if right else left)
return merged
二、算法分析
将归并排序分为两个过程来分析:分裂和归并
分裂的过程,借鉴二分查找中的分析结果,是对数复杂度,时间复杂度为O(log n)。
归并的过程,相对于分裂的每个部分,其所有的数据项都会被比较和放置一次,所以是线性复杂度,其复杂度是O(n)。
综合考虑,每次分裂的部分都进行一次O(n)数据项归并,总的时间复杂度是O(nlong n)。
最后,我们还注意到两个切片操作。
为了时间复杂度精确期间,可以通过取消切片操作,改为传递两个分裂部分的起始点和中指点,也是没问题的,只是算法的可读性会低一点。
我们注意到归并排序算法使用了额外1倍的存储空间用于归并。这个特性在对特大数据集进行排序的时候要考虑进去。