Leetcode4. 给定两个大小为 m 和 n 的有序数组 nums1 和 nums2。
请你找出这两个有序数组的中位数,并且要求算法的时间复杂度为 O(log(m + n))
。
你可以假设 nums1 和 nums2 不会同时为空。
示例 1:
nums1 = [1, 3]
nums2 = [2]
则中位数是 2.0
示例 2:
nums1 = [1, 2]
nums2 = [3, 4]
则中位数是 (2 + 3)/2 = 2.5
解析:看到时间复杂度为log级别,且是有序的数组,中位数也可以求最小第K个数的经典问题。因此采用二分法。但是这道题显然不能先求出合并后的数组,应该是不合并两个数组怎么求第K小的数。
逻辑流程 二分法解答:
- start = nums1和nums2中最小值
- end = nums1和nums2中最大值
- mid = (start+end)/2
-
if 两个数组中小于或等于mid的个数小于k:
中位数应该大于mid,那么答案在mid和end之间 -
if 两个数组中大于或等于mid的个数小于k:
中位数应该小于mid,那么答案在start和mid之间
因此可以看出该题目是二分查找的一个扩展题目,在两个数组中二分查找。
python 代码:
class Solution:
def findMedianSortedArrays(self, nums1: List[int], nums2: List[int]) -> float:
length = len(nums1) + len(nums2)
if length & 1: #分奇偶来讨论求第K小的数
mid = length // 2 + 1
return self.findKthSmallest(mid, nums1, nums2) #找到第K小的数
else:
mid1 = length // 2
mid2 = length // 2 + 1
return (self.findKthSmallest(mid1, nums1, nums2) +
self.findKthSmallest(mid2, nums1, nums2)) / 2.0
def findKthSmallest(self, k, nums1, nums2): #找到第K小的数
if not nums1:
return nums2[k - 1]
if not nums2:
return nums1[k - 1]
start = min(nums1[0], nums2[0])
end = max(nums1[-1], nums2[-1])
while start +1 < end: #当start紧跟end就停止,即不能达到相同状态
mid = start + (end - start) // 2 #防止溢出
if self.CountSmallorEq(mid, nums1) + self.CountSmallorEq(mid, nums2) < k:
start = mid
else:
end = mid
if self.CountSmallorEq(start, nums1) + self.CountSmallorEq(start, nums2) >= k:
return start
else:
return end
def CountSmallorEq(self, num, arr): #计算比num小或等于的数字有多少个
start, end = 0, len(arr)-1
while start + 1 < end:
mid = start + (end - start) // 2
if arr[mid] <= num:
start = mid
else:
end = mid
if arr[start] > num:
return start
if arr[end] > num:
return end
return len(arr)
总结: 就是在二分查找上进行改进,套用二分查找的模板,增加了一个统计一个有序数组比不大于k的个数,也是用二分查找来计算,如上面的函数CountSmallorEq
就是额外增加二分查找。
另外官方给出的统计的方法(官方答案),虽然能达到 O(log(min(m ,n)))
,但是需要分类讨论,情况复杂,不建议。
附: 二分查找代码:
def binary_search(arr, item):
"""二分查找 非递归方式"""
n = len(arr)
start = 0
end = n - 1
while start <= end:
mid = start + (end - start) // 2
if arr[mid] == item:
return True
elif item < arr[mid]:
end = mid - 1
else:
start = mid + 1
return False
二分查找有诸多延申的题目,本题就是一个。