简介
题目链接 Leetcode 23. Merge k Sorted Lists
作为链表的难度天花板之一,这道题依然不是很难。建议看解法之前先练习本题的简单版本LeetCode 21. Merge Two Sorted Lists。
注意:文章中一切注解皆为Python代码
理解题目
题目非常简单。给了K
个已排序的链表,把他们合并为一个新的+排好序的链表。如果你会合并两个链表,你就能合并K
个链表。合并两个链表的时候用的是双指针(每个链表各一个指针),合并K
个链表就可以用K
个指针。但是这种方法有个问题,让我们先看一下实现过程。
class Solution:
def mergeKLists(self, lists: List[ListNode]) -> ListNode:
n = len(lists)
cur = dummy = ListNode(-1)
while True:
cur_min = ListNode(sys.maxsize)
idx = -1
for i, node in enumerate(lists): # 每一次循环都遍历所有的链表首节点
if node and node.val < cur_min.val: # 但问题是有的节点可能已经到尽头了
cur_min = node # 却依然要继续遍历长度为K的链表集合`lists`
idx = i
if idx == -1: return dummy.next
cur.next = lists[idx]
cur = cur.next
lists[idx] = lists[idx].next
更优解
上面一种解法很好想,但问题也很明显,假设最终共有N
个节点,那么上面解法的时间复杂度则为稳定的O(KN)
。具体来说,每轮循环遍历长度为K
的列表,需要遍历N
次才能把所有节点排序好。
怎样避免重复访问已经被彻底用尽的链表呢?这里有一个非常巧妙地解法,利用了list
可以O(1)
索引的原理,配上一点小小的数学技巧。
- 第一轮循环,间隔为1的链表相互合并,比如将第一、二个链表合并,第三,四个链表合并…以此类推,合并后的链表统一放在前面那个链表上(第一,三,五…个链表上);现在有效链表仅仅存在于一,三,五…号链表上
- 第二轮循环,间隔为2的链表相和并,比如一,三合并;五,七合并等等;现在有效链表仅存在于一,五,九…号链表上
跟据这个规律每次扩大间隔的倍数,最终所有的链表都会被合并在lists[0]
上面;具体过程如下
class Solution:
def mergeKLists(self, lists):
if not lists: return None
amount = len(lists)
interval = 1
while interval < amount:
for i in range(0, amount - interval, interval * 2): # 控制间隔和上限
lists[i] = self.merge2Lists(lists[i], lists[i + interval]) # 按照间隔合并两个链表,并放在小索引上防止合并后的链表
interval *= 2 # 更新间隔
return lists[0]
def merge2Lists(self, l1, l2): # LeetCode 21 的解法,合并两个已排序链表
dummy = cur = ListNode(-1)
while l1 and l2:
if l1.val <= l2.val:
cur.next = l1
l1 = l1.next
else:
cur.next = l2
l2 = l2.next
cur = cur.next
if not l1: cur.next = l2
else: cur.next = l1
return dummy.next
用这种解法就可以避免永远遍历K
个元素,由于每次循环,有效节点的数目都减半(间隔增大一倍),因此这种方法的时间复杂度是O(NlogK)
。具体来讲就是,每轮循环都会遍历全部N
个节点,但一共需要logK
次循环。
解题后的思考
从2到多有时候就是简单的归纳法,但如果归纳的起始状态就错了呢?对于这道题,如果一开始合并两个链表时,就用间隔的方法,那么归纳就是对的,可惜事实并非如此。
我想更合理的思考过程应该是,如果发现解法有严重的缺点,应该去思考有没有更好的解法。利用list
和数学的方法有效的提高了性能,看来提高性能不一定非要使用高级的数据结构,把基础的玩出花样,一样可以效果非凡。