(2)当A[k/2-1]>B[k/2-1]时存在类似的结论。
(3)当A[k/2-1]=B[k/2-1]时,我们已经找到了第k小的数,也即这个相等的元素,我们将其记为m。由于在A和B中分别有k/2-1个元素小于m,所以m即是第k小的数。(这里可能有人会有疑问,如果k为奇数,则m不是中位数。这里是进行了理想化考虑,在实际代码中略有不同,是先求k/2,然后利用k-k/2获得另一个数。)
通过上面的分析,我们即可以采用递归的方式实现寻找第k小的数。此外我们还需要考虑几个边界条件:
- 如果A[k/2-1]=B[k/2-1],返回其中一个;
/************************************************************************/
/* method1: O(nlogn) merge */
/************************************************************************/
double findMedianSortedArrays1(int A[], int m, int B[], int n)
{
int *a=new int[m+n];
memcpy(a,A,sizeof(int)*m);
memcpy(a+m,B,sizeof(int)*n);
sort(a,a+n+m);
double median = (double) ((n+m)%2? a[(n+m)>>1]:(a[(n+m-1)>>1]+a[(n+m)>>1])/2.0);
delete a;
return median;
}
/************************************************************************/
/* method2: O(log(m+n)) find topK, always compare half K of each */
/************************************************************************/
double findKth(int A[], int m, int B[], int n, int k) // 第k个
{
if(m > n) // a始终为较小数组
return findKth(B, n, A, m, k);
if(m == 0)
return B[k-1];
if(k == 1) // 递归最后a,b只剩一个元素时,第k个应该是较小的那个
return min(A[k-1], B[k-1]);
int pa = min(k/2,m), pb = k - pa; // 经验:除2用移位做更快
if(A[pa-1] < B[pb-1]) // 递归寻找k,O(logk),每次比较来排除掉k个,a中每次取第k/2个(或者当a长度不到k/2时1取最后一位),b取第k-k/2个
return findKth(A+pa, m-pa, B, n, k-pa); // 已经筛选出pa个,
else if(A[pa-1] > B[pb-1])
return findKth(A, m, B+pb, n-pb, k-pb); // 已经筛选出pb个
else
return A[pa-1];
}
double findMedianSortedArrays2(int A[], int m, int B[], int n) // top K
{
if((m+n)%2) // 奇数个; 经验:余2用与操作,&0x1(0x表示16进制)
return findKth(A, m, B, n, (m+n)/2+1);
else
return ( findKth(A, m, B, n, (m+n)/2) + findKth(A, m, B, n, ((m+n)/2+1)) )/2.0;
}
void test_findMedianSortedArrays()
{
int A[6] = {1, 2, 3, 4, 7, 8};
int B[8] = {3, 4, 5, 6, 8, 9, 10, 11};
cout << "findMedianSortedArrays: " << findMedianSortedArrays2(A, 6, B, 8) << endl;
}