归并排序是建立在归并操作上的一种有效的排序算法。
该算法是采用分治法(Divide and Conquer)的一个非常典型的应用。归并排序是一种稳定的排序方法。将已有序的子序列合并,得到完全有序的序列;即先使每个子序列有序,再使子序列段间有序。若将两个有序表 合并成一个有序表,称为2-路归并
归并排序的思路
给定待排序的数组 data_list,长度为 n ,设置首尾两个游标 p,q,初始状态,p = 0,q = n, 先不纠结是 n 还是 n-1 。
分解: 取中间值 r = (p + q)/2 ,将数组分成左部分 data_list[p,r],右部分 data_list[r+1,q] 。
对上述左右部分递归调用分解。 归并左部分和右部分的结果。 退出条件是 p>=q。
def merge_sort(data_list):
length = len(data_list)
merge_sort_c(data_list, 0, length)
def merge_sort_c(data_list, p, q):
if p + 1 >= q:
return
else:
r = (p + q)//2
merge_sort_c(data_list, p, r)
merge_sort_c(data_list, r, q)
merge(data_list, p, r, q)
def merge(data_list, p, r, q):
tmp = []
i = p
j = r
while i < r and j < q:
if data_list[i] <= data_list[j]:
tmp.append(data_list[i])
i += 1
else:
tmp.append(data_list[i])
j += 1
while i < r:
tmp.append(data_list[i])
i += 1
while j < q:
tmp.append(data_list[j])
j += 1
for temp_index, index in enumerate(range(p, q)):
data_list[index] = tmp[temp_index]
unsort = [1,3,4,2,1,5,6,7,8,4]
print(merge_sort(unsort))
print(unsort)
性能分析
1、时间复杂度:归并排序不关心数组的初始状态,因此最好、最坏、平时时间复杂度都是一样的,为O(nlogn)
2、空间复杂度:O(n),因此它不是一个原地排序算法。递归代码的空间复杂度并不能像时间复杂度那样累加。尽管每次合并操作都需要申请额外的内存空间,但在合并完成之后,临时开 辟的内存空间就被释放掉了。在任意时刻,CPU 只会有一个函数在执行,也就只会有一个临 时的内存空间在使用。临时内存空间最大也不会超过 n 个数据的大小,所以空间复杂度是 O(n)。
3、稳定性:稳定。我们对数组分成左右两部分,对于两边相同的值,我们可以选择将右部分 的值归并后放在左边相同值的后面,因此它是稳定的排序算法。