一、题设
给定两个大小分别为 m 和 n 的正序(从小到大)数组 nums1 和 nums2。请你找出并返回这两个正序数组的 中位数 。
算法的时间复杂度应该为 O(log (m+n)) 。
二、基本思路
1.将两个列表合并后排序,借助二分法左右向中间逼近即可。
2.若左右指针重合,那么列表个数为奇数,中位数即为左右指针所指向那个数。
3.若左指针在右指针右边,那么列表个数为偶数,中位数即为左右指针所指向数值的均值。
三、代码实现
def findMedianSortedArrays(self, nums1, nums2):
#列表合并
lis = nums1 + nums2
#排序
lis.sort()
left = 0
right = len(lis)-1
#左右指针逼近
while(left<right):
left += 1
right -= 1
#奇数个数列表
if left == right:
return lis[left]
#偶数个数列表
else:
return (lis[left]+lis[right])/2.0
四、效率总结
这题其实没有解出来,因为这题要求了m+n的复杂度,而python因为简化了一些代码的编写,但实际语言操作机器的底层的消耗是没有改变的,再回过头看这段代码:其中, lis = nums1 + nums2实际有O(max((len(list1)),len(list2)))的复杂度;列表中的sort()函数为O(n*log2n)的复杂度,而while循环有O(根号下m+n)的复杂度。综上所述,也是有O(n*log2n)的复杂度,这大大超越了题目要求的复杂度,因此只得换一种算法:
一、基本思路
1.分成总个数为奇数和偶数分别讨论,两个列表划分为两边,其中左边的最大元素小于右边的最小元素,根据条件找到分隔线位置。
2.总个数为奇数的列表,划分后左边比右边个数多1,那么中位数即为左边最大元素;总个数为偶数的列表,划分后左右两边相等,中位数为(左边最大元素+右边最小元素)/2
二、代码实现
def findMedianSortedArrays(self, nums1: List[int], nums2: List[int]) -> float:
def getKthElement(k):
"""
- 主要思路:要找到第 k (k>1) 小的元素,那么就取 pivot1 = nums1[k/2-1] 和 pivot2 = nums2[k/2-1] 进行比较
- 这里的 "/" 表示整除
- nums1 中小于等于 pivot1 的元素有 nums1[0 .. k/2-2] 共计 k/2-1 个
- nums2 中小于等于 pivot2 的元素有 nums2[0 .. k/2-2] 共计 k/2-1 个
- 取 pivot = min(pivot1, pivot2),两个数组中小于等于 pivot 的元素共计不会超过 (k/2-1) + (k/2-1) <= k-2 个
- 这样 pivot 本身最大也只能是第 k-1 小的元素
- 如果 pivot = pivot1,那么 nums1[0 .. k/2-1] 都不可能是第 k 小的元素。把这些元素全部 "删除",剩下的作为新的 nums1 数组
- 如果 pivot = pivot2,那么 nums2[0 .. k/2-1] 都不可能是第 k 小的元素。把这些元素全部 "删除",剩下的作为新的 nums2 数组
- 由于我们 "删除" 了一些元素(这些元素都比第 k 小的元素要小),因此需要修改 k 的值,减去删除的数的个数
"""
index1, index2 = 0, 0
while True:
# 特殊情况
if index1 == m:
return nums2[index2 + k - 1]
if index2 == n:
return nums1[index1 + k - 1]
if k == 1:
return min(nums1[index1], nums2[index2])
# 正常情况
newIndex1 = min(index1 + k // 2 - 1, m - 1)
newIndex2 = min(index2 + k // 2 - 1, n - 1)
pivot1, pivot2 = nums1[newIndex1], nums2[newIndex2]
if pivot1 <= pivot2:
k -= newIndex1 - index1 + 1
index1 = newIndex1 + 1
else:
k -= newIndex2 - index2 + 1
index2 = newIndex2 + 1
m, n = len(nums1), len(nums2)
totalLength = m + n
if totalLength % 2 == 1:
return getKthElement((totalLength + 1) // 2)
else:
return (getKthElement(totalLength // 2) + getKthElement(totalLength // 2 + 1)) / 2
三、效率总结
在复杂度方面,达到了O(m+n),但是在空间和时间利用率上面不如第一种做法,那么究竟是为了复杂度而追求代码复杂度,还是为了具体减少空间时间的利用率去直接求解呢?这两种选择就是仁者见仁智者见智了!(看应用场景)