问题:
There are two sorted arrays A and B of size m and n respectively. Find the median of the two sorted arrays. The overall run time complexity should be O(log (m+n)).
思路是找到第k小。
解法一(没有优化时间)
双指针,一个指向A,一个指向B。
double findMedianSortedArrays(int A[], int m, int B[], int n)
{
if((m==0)&&(n==0))
return 0;
int k=(int)((m+n)/2+1);
int* tmp=new int[k];
int x=0,y=0;
for(int i=0;i<k;i++)
{
if(x>=m&&y<n)
{
tmp[i]=B[y];
y++;
continue;
}
if(x<m&&y>=n)
{
tmp[i]=A[x];
x++;
continue;
}
if(A[x]<=B[y])
{
tmp[i]=A[x];
x++;
}
else
{
tmp[i]=B[y];
y++;
}
}
if((m+n)%2==0)
{
return (double)(tmp[k-1]+tmp[k-2])/2;
}
else
return tmp[k-1];
}
解法二(优化了时间,用了分治)
首先假设数组A和B的元素个数都大于k/2,我们比较A[k/2-1]和B[k/2-1]两个元素,这两个元素分别表示A的第k/2小的元素和B的第k/2小的元素。这两个元素比较共有三种情况:>、<和=。如果A[k/2-1]<B[k/2-1],这表示A[0]到A[k/2-1]的元素都在A和B合并之后的前k小的元素中。换句话说,A[k/2-1]不可能大于两数组合并之后的第k小值,所以我们可以将其抛弃。
当A[k/2-1]>B[k/2-1]时存在类似的结论。
当A[k/2-1]=B[k/2-1]时,我们已经找到了第k小的数,也即这个相等的元素,我们将其记为m。由于在A和B中分别有k/2-1个元素小于m,所以m即是第k小的数。(这里可能有人会有疑问,如果k为奇数,则m不是中位数。这里是进行了理想化考虑,在实际代码中略有不同,是先求k/2,然后利用k-k/2获得另一个数。)
通过上面的分析,我们即可以采用递归的方式实现寻找第k小的数。此外我们还需要考虑几个边界条件:
- 如果A或者B为空,则直接返回B[k-1]或者A[k-1];
- 如果k为1,我们只需要返回A[0]和B[0]中的较小值;
- 如果A[k/2-1]=B[k/2-1],返回其中一个。
int findkth(int A[], int m, int B[], int n, int kth)
{
//assert(A!=NULL&&B!=NULL);
//assert(kth>=0&&kth<=m+n);
if(m>n)
return findkth(B, n, A, m, kth);
if(m==0)
return B[kth-1];
if(kth==1)
return min(A[0],B[0]);
int pa=min(m,kth/2), pb=kth-pa;
if(A[pa-1]<B[pb-1])
{
return findkth(A+pa, m-pa, B, n, kth-pa);
}
else if (A[pa-1]>B[pb-1])
{
return findkth(A, m, B+pb, n-pb, kth-pb);
}
else
{
return A[pa-1];
}
}
double findMedianSortedArrays_2(int A[], int m, int B[], int n)
{
//assert(A!=NULL&&B!=NULL);
if((m==0)&&(n==0))
return 0;
int k=m+n;
if(k%2!=0)
return (double)findkth(A, m, B, n, (k+1)/2);
else
return (double)(findkth(A, m, B, n, k/2)+findkth(A, m, B, n, k/2+1))/2;
}