MIT6.0001最后一节课“Searching and Sorting”中讲到归并排序,首先我承认归并排序算法的时间复杂度可以做到O(n*log(n)),简单的公式推导见下方第1部分。但是,如果看过该课程或者课程配套书籍的同学,会注意到MIT实现归并排序的代码(见下方第2部分的代码),我认为该代码的时间复杂度不是O(n*log(n)),而是O(n*n*log(n)),原因在于MIT的这个归并排序代码每递归一次,都要复制一次列表,而复制列表的时间复杂度就是O(n),因此O(n*log(n))*O(n)=O(n*n*log(n)),当然在本文最后我会从公式推导之外的另一个角度阐述我的这一结论,见下方第3部分。如有不妥或错误之处,还请各位大佬不吝指正。
1. 首先是简单的公式推导,用来说明归并排序算法的时间复杂度是O(n*log(n))
2. 接下来会列出MIT的归并排序代码实现,MIT似乎认为该代码的时间复杂度为O(n*log(n)),但是我认为这个代码的时间复杂度为O(n*n*log(n))
def merge(left, right):
result = []
i,j = 0,0
while i < len(left) and j < len(right):
if left[i] < right[j]:
result.append(left[i])
i += 1
else:
result.append(right[j])
j += 1
while (i < len(left)):
result.append(left[i])
i += 1
while (j < len(right)):
result.append(right[j])
j += 1
return result
def merge_sort(L):
if len(L) < 2:
return L[:]
else:
middle = len(L)//2
left = merge_sort(L[:middle])
right = merge_sort(L[middle:])
return merge(left, right)
merge_sort(L)
3. 最后,我将针对该代码尝试从公式推导之外的角度来阐释其时间复杂度
如下图所示,merge_sort函数中未框中的部分,时间复杂度都是O(1),因此我们的关注点主要在框中的部分。红框是一个递归,是将元素个数大于1的列表递归成元素个数为1的列表,每次递归相比原来的列表元素减半,因此递归的时间复杂度为O(log(n));同时需注意,每次递归的时候我们都将列表进行了一次复制,复制列表的时间复杂度为O(n),即绿框部分;当我们递归出只含一个元素的列表时,就可以进行合并排序,而有序列表的合并排序的时间复杂度都是O(n),之前每递归出一层,现在在这一层就会有n次的合并排序,即蓝框部分;因此该代码实现的算法复杂度我认为是O(n)*O(log(n))*O(n)=O(n*n*log(n))