10.19
题目:
给定两个大小为 m 和 n 的有序数组 nums1 和 nums2。
请你找出这两个有序数组的中位数,并且要求算法的时间复杂度为 O(log(m + n))。
你可以假设 nums1 和 nums2 不会同时为空。
一般遇到log,就是二分了
解法一
简单粗暴,先将两个数组合并,两个有序数组的合并也是归并排序中的一部分。然后根据奇数,还是偶数,返回中位数。
时间复杂度:遍历全部数组 (m+n)
空间复杂度:开辟了一个数组,保存合并后的两个数组 O(m+n)
解法二
其实,我们不需要将两个数组真的合并,我们只需要找到中位数在哪里就可以了。
时间复杂度:遍历 len/2+1 次,len=m+n,所以时间复杂度依旧是 O(m+n)
解法三(时间复杂度符合要求)
很精妙的算法,但也很容易由于考虑不全而出错(也属于二分)
上边的两种思路,时间复杂度都达不到题目的要求 (1)O(log(m+n)O(log(m+n)O(log(m+n)。看到 log,很明显,我们只有用到二分的方法才能达到。我们不妨用另一种思路,题目是求中位数,其实就是求第 k 小数的一种特殊情况,而求第 k 小数有一种算法。
解法二中,我们一次遍历就相当于去掉不可能是中位数的一个值,也就是一个一个排除。由于数列是有序的,其实我们完全可以一半儿一半儿的排除。假设我们要找第 k 小数,我们可以每次循环排除掉 k/2 个数。看下边一个例子。
假设我们要找第 7 小的数字。
1 3 ***4*** 9
*1 2 ***3**** 4 5 6 7 8 9 10
我们比较两个数组的第 k/2 个数字,如果 k 是奇数,向下取整。也就是比较第 333 个数字,上边数组中的 444 和下边数组中的 333,如果哪个小,就表明该数组的前 k/2 个数字都不是第 k 小数字,所以可以排除。也就是 111,222,333 这三个数字不可能是第 777 小的数字,我们可以把它排除掉。将 134913491349 和 456789104567891045678910 两个数组作为新的数组进行比较。
第二个数组的前三个数字1 2 3表示已经去掉的数字。
(2)由于我们已经排除掉了 3 个数字,就是这 3 个数字一定在最前边,所以在两个新数组中,我们只需要找第 7 - 3 = 4 小的数字就可以了,也就是 k = 4。此时两个数组,比较第 2 个数字,3 < 5,所以我们可以把小的那个数组中的 1 ,3 排除掉了。
***1 3*** 4 9
***1 2 3*** 4 5 6 7 8 9 10
(3)我们又排除掉 2 个数字,所以现在找第 4 - 2 = 2 小的数字就可以了。此时比较两个数组中的第 k / 2 = 1 个数,4 == 4,怎么办呢?由于两个数相等,所以我们无论去掉哪个数组中的都行,因为去掉 1 个总会保留 1 个的,所以没有影响。为了统一,我们就假设 4 > 4 吧,所以此时将下边的 4 去掉。
***1 3*** 4 9
***1 2 3 4*** 5 6 7 8 9 10
(4)由于又去掉 1 个数字,此时我们要找第 1 小的数字,所以只需判断两个数组中第一个数字哪个小就可以了,也就是 4。
所以第 7 小的数字是 4。
(4)我们每次都是取 k/2 的数进行比较,有时候可能会遇到数组长度小于 k/2的时候。
1 2
1 2 3 4 5 6 7 8 9 10
此时 k / 2 等于 3,而上边的数组长度是 2,我们此时将箭头指向它的末尾就可以了。这样的话,由于 2 < 3,所以就会导致上边的数组 1,2 都被排除。造成下边的情况。
***1 2***
1 2 3 4 5 6 7 8 9 10
(5)由于 2 个元素被排除,所以此时 k = 5,又由于上边的数组已经空了,我们只需要返回下边的数组的第 5 个数字就可以了。
从上边可以看到,无论是找第奇数个还是第偶数个数字,对我们的算法并没有影响,而且在算法进行中,k 的值都有可能从奇数变为偶数,最终都会变为 1 或者由于一个数组空了,直接返回结果。
所以我们采用递归的思路,为了防止数组长度小于 k/2,所以每次比较 min(k/2,len(数组) 对应的数字,把小的那个对应的数组的数字排除,将两个新数组进入递归,并且 k 要减去排除的数字的个数。递归出口就是当 k=1 或者其中一个数字长度是 0 了。
double findMedianSortedArrays(int* nums1, int nums1Size, int* nums2, int nums2Size){
int left=(nums1Size+nums2Size+1)/2;
int right=(nums1Size+nums2Size+2)/2;
将偶数和奇数的情况合并,如果是奇数,会求两次同样的 k 。
double a=(get(nums1,0,nums1Size-1,nums2,0,nums2Size-1,left)+get(nums1,0,nums1Size-1,nums2,0,nums2Size-1,right))*0.5;
return a;
}
int get(int *nums1,int left1,int right1,int *nums2,int left2,int right2,int k){
int len1=right1-left1+1;
int len2=right2-left2+1;
// //让 len1 的长度小于 len2,这样就能保证如果有数组空了,一定是 len1
if(len1>len2)
return get(nums2,left2,right2,nums1,left1,right1,k);
if(len1==0)
{
int kk=left2+k-1;
return nums2[kk];
}
if(k==1){
return min(nums1[left1],nums2[left2]);
}
(1) //注意此处,要取len和k/2小的
int i=left1+min(len1,k/2)-1;
int j=left2+min(len2,k/2)-1;
if(nums1[i]>nums2[j]){
(2)//注意此处最后的参数不是直接k-k/2,因为可能len<k/2,此时去掉的不是k/2个数,而是len个数
return get(nums1,left1,right1,nums2,j+1,right2,k-(j-left2+1));
}
else{
return get(nums1,i+1,right1,nums2,left2,right2,k-(i-left1+1));
}
}
int min(int a,int b){
if(a>b)
return b;
return a;
}