问题描述:
There are two sorted arrays nums1 and nums2 of size m and n respectively. Find the median of the two sorted arrays. The overall run time complexity should be O(log (m+n)).
意即找到2个排序数组合并之后的中位数。条件是复杂度控制在O(log(m+n)),这是本题难点所在!题目难度为HARD,真是名副其实的hard!
思路分析:
刚上来刷Leetcode,这才刷几道题而已就碰到思路被堵的情况。一上来想着定义一个指针,从小到大一个一个进行比较,进行n/2次循环,即可找到。这样下来复杂度为O(n/2),不满足题目要求。这可是我能想到的最快的方法了。。。。
思路就这样堵死了!堵死了!堵死了!
重新从头开始整理思路。第一肯定是需要从中位数的性质入手,第二就是根据要求的复杂度,联想到肯定是使用二分的思路 采用递归的形式进行查找。然而。。。。
思路还是堵死了!堵死了!堵死了!
本来想较劲的,非得自己想出来不可,结果想了2天,草稿纸都换了好几张了,还是。。。。
思路还是堵死了!堵死了!堵死了!
无奈想先百度中位数的性质,没想到很快就搜到CSDN了。得到http://blog.csdn.net/zxzxy1988/article/details/8587244,豁然开朗!
思路总结:
借助于一个寻找2个数组合并后寻找第K小的数的一个算法,这样求中位数就等于 求第 (nums1Size+nums2Size+1)/2 小的数。(便于说明只列举了总个数为奇数的情况,偶数的情况类似,见于代码)
为什么采有求第K小的数这个辅助函数呢?因为这样可以使用二分的思路达到题设要求!我们假设把K一分为二,在2个数组中各找出前K/2个数,做个判断。如果第一个数组中第K/2个数较小,即nums1[k/2]<nums2[K/2],那么可以剔除掉数组一中的前K/2个数,因为他们一定在合并后的数组的前K小的数中,这又是为什么呢?可以用反证法。证明时需要注意,2个子数组都是有序的!
这样每次都剔除掉比较小的那部分,把剩下的部分又重新进行递归,这次要找的是前 K-(剔除掉的数的个数) 小的数,这样就可以慢慢的定位到了第K个数。
一共要找K=(m+n)/2个数,每次都是以这种二分的方式进行剔除,每次都近似于剔除掉K/2个数,所以算法复杂度是O( log( (m+n)/2 ) ),满足要求!
最后AC的代码如下(20ms):
int min(int a,int b)
{
return a<b ? a:b;
}
double findKthNum( int* a, int an, int* b, int bn, int k)
{
if( an>bn )
return findKthNum( b, bn, a, an ,k);
if( an==0)
return b[k-1];
if( k==1 )
return min( a[0],b[0]);
int p1=min( an, k/2 );
int p2= k- p1;
if( a[p1-1] < b[p2-1])
return findKthNum( a+p1, an-p1, b, bn, k-p1);
else if( a[p1-1] > b[p2-1])
return findKthNum( a, an, b+p2, bn-p2, k-p2);
else
return a[p1-1];
}
double findMedianSortedArrays(int* nums1, int nums1Size, int* nums2, int nums2Size)
{
int size = nums1Size + nums2Size;
if( size & 1 )
return findKthNum( nums1, nums1Size, nums2, nums2Size, (size+1 )/2 );
else
return 0.5 * ( findKthNum(nums1, nums1Size, nums2, nums2Size, size/2 ) +
findKthNum(nums1, nums1Size, nums2, nums2Size, size/2 + 1 ));
}