Median of Two Sorted Arrays with O(log (m+n)).两个排序数组寻找中位数

leetcode算法题4:Median of Two Sorted Arrays

算法题目描述:There are two sorted arrays nums1 and nums2 of size m and n respectively. Find the median of the two sorted arrays. The overall run time complexity should be O(log (m+n)). You may assume nums1 and nums2 cannot be both empty.

1. 算法解决过程

  1. 首先需要了解什么是中位数,中位数用来:

    把一个大集合分成两个长度相等的子集,右边的子集总是大于左边的子集如果大集合的长度为偶数,则中位数是中间两个数的平均数,如果长度为奇数,则中位数则是最中间的那一位数字

  2. 利用折半查找的思想,对两个排序数组进行分割,如A在位置i处被分割成两段,
    在这里插入图片描述
    由于A有m个元素,因此分割位置总共有m+1个,(i = 0~m).需要注意,当i=0 时,Left_A为空,当i = m时,Right_A为空。分割之后:

    len(left_A)=i,
    len(right_A)=m−i.

    同理,用相同的方法来分割B,B在j处被分割为两段,
    在这里插入图片描述

  3. 顺序数组A和B都被分割之后,将Left_A和和Left_B放在一起,Right_A和Right_B放在一起,如下图所示;
    在这里插入图片描述
    需要保证如下条件,才能求得中位数:
    1.max(Left_part)<=min(Right_part) , B[j-1]<=A[i] && A[i-1]<=B[j]
    2.i + j = (m+n+1)/ 2

    之所以需要满足条件2是因为:i + j是left_part的长度,m+n是集合总长度,
    当m+n是偶数时,(m+n+1)/ 2用的是整除(注意python应该用// ),得到的长度是总长度的一半;
    当m+n是奇数时,(m+n+1)/ 2用的是整除(注意python应该用// ),得到的长度是总长度的一半再加1;
    i + j = (m+n+1)/ 2保证了Left_part的长度等于Right_part或者比Right_part多一个。可以得到:j = (m+n+1)/ 2 - i, 需要注意的是n>=m, 因为n如果小于m,当i取m时,j可能会变成负数

  4. 开始求中位数:

    (1) 当m+n为偶数时,median= (max(left_part)+min(right_part))/ 2
    (2)当m+n为奇数时,由于左边的数字个数比右边多一个,所以中位数一定在左边,median= max(left_part)

2. 具体算法描述

(1) 设imin = 0, imax = m, 在[imin,imax]中进行折半查找
(2) i = (imin + imax)/2, j = (m+n+1)/2 - i (python中注意用//)
(3) 通过(2)可以确定len(Left_part) = len(Right_part),或者len(Left_part)= len(Right_part) + 1。然后需要确定:
max(Left_part)<=min(Right_part), 即max(Left_B)<=min(Right_A) && max(Left_A)<=ming(Right_B)
  有以下三种情况:
1. B[j-1]<=A[i] && A[i-1]<=B[j], 顺利找到 i , j 的位置停止搜索。
  2. B[j-1]>A[i], 此时说明A分割的位置太靠左,需要大一点,因此将 i 向右边移动一步,令imin = i+1, 然后转到(2)
  3. A[i-1]>B[j], 此时说明A分割的位置太靠右,需要小一点,因此将 i 向左边移动一步,令imax = i-1, 然后转到(2)

边界问题考虑
  当i = 0时,说明Left_part没有A的部分,令max(Left_A) = 负无穷;当i = m时,说明Right_part部分没有A的部分,令min(Right_A) = 正无穷。
  当j = 0时,说明Left_part没有B的部分,令max(Left_B) = 负无穷;当j = n时,说明Right_part部分没有B的部分,令min(Right_B) = 正无穷。

(4) 求出中位数:
  当m+n为偶数时,median= (max(left_part)+min(right_part))/ 2
  当m+n为奇数时,由于左边的数字个数比右边多一个,所以中位数一定在左边,median= max(left_part)

3. python实现代码

class Solution:
    def findMedianSortedArrays(self, nums1: List[int], nums2: List[int]) -> float:
        len_array1 = len(nums1)
        len_array2 = len(nums2)
        if len_array1 > len_array2:
            return self.findMedianSortedArrays(nums2, nums1)
        # 要o(log(m+n)的复杂度,所以要折半查找
        low = 0
        high = len_array1
        while low <= high:
            array1_portion = (low + high) // 2
            array2_portion = (len_array1 + len_array2 + 1) // 2 - array1_portion
            # 两个数组分别分成两段之后,分别比较分段点前后数字的大小,需要考虑左边没有或者右边没有的情况
            maxLeft_array1 = (array1_portion == 0) and -float('inf') or nums1[array1_portion - 1]
            minRight_array1 = (array1_portion == len_array1) and float('inf') or nums1[array1_portion]

            maxLeft_array2 = (array2_portion == 0) and -float('inf') or nums2[array2_portion - 1]  
            minRight_array2 = (array2_portion == len_array2) and float('inf') or nums2[array2_portion]

            if maxLeft_array1 <= minRight_array2 and maxLeft_array2 <= minRight_array1:
                if (len_array1 + len_array2) % 2 == 0:
                    median = (max(maxLeft_array2, maxLeft_array1) + min(minRight_array2, minRight_array1)) / 2
                    return median
                else:
                    median = max(maxLeft_array1, maxLeft_array2)
                    return median
            elif maxLeft_array1 > minRight_array2:
                high = array1_portion - 1
            else:
                low = array1_portion + 1
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值