寻找两个有序数组的中位数
题目描述:给定两个大小为 m 和 n 的有序数组 nums1 和 nums2。请你找出这两个有序数组的中位数,并且要求算法的时间复杂度为 O(log(m + n))。你可以假设 nums1 和 nums2 不会同时为空。
示例 1:
nums1 = [1, 3]
nums2 = [2]
则中位数是 2.0
示例 2:
nums1 = [1, 2]
nums2 = [3, 4]
则中位数是 (2 + 3)/2 = 2.5
解题思路:这一题给定了时间复杂度为O(log(n+m)),所以应该想到使用二分法,不过想了好久还是没有想到怎么使用二分,对谁二分,二分的依据是什么。在借鉴了别人的想法之后,豁然顿开,十分巧妙。首先了解中位数的定义,如果是奇数,就是第(n+1)/2个数,反之就是最中间的两个数相加除以2。假设两个有序数组的长度分别为m和n,由于两个数组长度之和 m+n 的奇偶不确定,因此需要分情况来讨论,对于奇数的情况,直接找到最中间的数即可,偶数的话需要求最中间两个数的平均值。为了简化代码,不分情况讨论,我们使用一个小trick,我们分别找第 (m+n+1) / 2 个,和 (m+n+2) / 2 个,然后求其平均值即可,这对奇偶数均适用。加入 m+n 为奇数的话,那么其实 (m+n+1) / 2 和 (m+n+2) / 2 的值相等,相当于两个相同的数字相加再除以2,还是其本身。
这里我们需要定义一个函数来在两个有序数组中找到第K个元素,下面重点来看如何实现找到第K个元素。首先,为了避免产生新的数组从而增加时间复杂度,我们使用两个变量i和j分别来标记数组nums1和nums2的起始位置。然后来处理一些corner cases,比如当某一个数组的起始位置大于等于其数组长度时,说明其所有数字均已经被淘汰了,相当于一个空数组了,那么实际上就变成了在另一个数组中找数字,直接就可以找出来了。还有就是如果K=1的话,那么我们只要比较nums1和nums2的起始位置i和j上的数字就可以了。难点就在于一般的情况怎么处理?因为我们需要在两个有序数组中找到第K个元素,为了加快搜索的速度,我们要使用二分法,那么对谁二分呢,数组么?其实要对K二分,意思是我们需要分别在nums1和nums2中查找第K/2个元素,注意这里由于两个数组的长度不定,所以有可能某个数组没有第K/2个数字,所以我们需要先check一下,数组中到底存不存在第K/2个数字,如果存在就取出来,否则就赋值上一个整型最大值。如果某个数组没有第K/2个数字,那么我们就淘汰另一个数字的前K/2个数字即可。有没有可能两个数组都不存在第K/2个数字呢,这道题里是不可能的,因为我们的K不是任意给的,而是给的m+n的中间值,所以必定至少会有一个数组是存在第K/2个数字的。最后就是二分法的核心啦,比较这两个数组的第K/2小的数字midVal1和midVal2的大小,如果第一个数组的第K/2个数字小的话,那么说明我们要找的数字肯定不在nums1中的前K/2个数字,所以我们可以将其淘汰,将nums1的起始位置向后移动K/2个,并且此时的K也自减去K/2,调用递归。反之,我们淘汰nums2中的前K/2个数字,并将nums2的起始位置向后移动K/2个,并且此时的K也自减去K/2,调用递归即可,参见代码如下:
int min(int a,int b){
return a>b?b:a;
}
double findKth(int *a,int lena,int *b,int lenb,int k)
{
int vala,valb;
//如果其中有一个数组为空,则直接从另外一个数组中找第K小的数(也就是中位数)
if(lena<=0) return b[k-1];
if(lenb<=0) return a[k-1];
//k为1,表示只要找一个数就可以了
if(k==1) return min(a[0],b[0]);
vala=(k/2>lena)?__INT_MAX__:a[k/2-1];
valb=(k/2>lenb)?__INT_MAX__:b[k/2-1];
//a数组的前k/2个数都不可能是第K小的数,删掉
if(vala<valb){
return findKth(a+k/2,lena-k/2,b,lenb,k-k/2);
}
else{
return findKth(b+k/2,lenb-k/2,a,lena,k-k/2);
}
}
double findMedianSortedArrays(int* nums1, int nums1Size, int* nums2, int nums2Size){
int left,right;
left=(nums1Size+nums2Size+1)/2;
right=(nums1Size+nums2Size+2)/2;
return (findKth(nums1,nums1Size,nums2,nums2Size,left)+findKth(nums1,nums1Size,nums2,nums2Size,right))/2.0;
}