There are two sorted arrays A and B of size m and n respectively. Find the median of the two sorted arrays. The overall run time complexity should be O(log (m+n)).
看到这个问题,最初觉得很容易。做起来其实不然,为什么呢?这个问题给我的第一印象,就是merge sort(归并排序)里面的merge操作。如果我们不考虑空间复杂度的话,我相信这个一个相当容易的问题。先把它们合并在一次,然后,就可以找到我们想要的中位数了。但是,那样的话,算法看上去泰国笨重,肯定不是LEET想要的答案。
那么我们可不可以从逻辑上把这两个序列直接看成是一个序列呢?这个感觉不是什么问题。那么当我们要找到第k个数的话,代码应该是这个样子的。
double findKthElement(int A[], int m, int B[], int n, int k){
double returnValue;
int ii = 0;
int jj = 0;
for(;k >= 0; k --)
{
if(ii < m && jj < n)
{
returnValue = A[ii] < B[jj] ? A[ii ++] : B[jj ++];
}
else if(ii < m)
{
returnValue = A[ii ++];
}
else if(jj < n)
{
returnValue = B[jj ++];
}
}
return returnValue;
}
这样,就可以找到第k个位置的数了。对于中位数,如果是偶数,那么就是中间的两个数的平均数,如果是奇数,就是中间那个数。
double findMedianSortedArrays(int A[], int m, int B[], int n) {
if((m + n) % 2 == 1)
return findKthElement(A, m, B, n, (m + n) / 2);
else
return (findKthElement(A, m, B, n, (m + n) / 2) + findKthElement(A, m, B, n, (m + n) / 2 - 1)) / 2;
}
最后的结果:
class Solution {
public:
double findKthElement(int A[], int m, int B[], int n, int k){
double returnValue;
int ii = 0;
int jj = 0;
for(;k >= 0; k --)
{
if(ii < m && jj < n)
{
returnValue = A[ii] < B[jj] ? A[ii ++] : B[jj ++];
}
else if(ii < m)
{
returnValue = A[ii ++];
}
else if(jj < n)
{
returnValue = B[jj ++];
}
}
return returnValue;
}
double findMedianSortedArrays(int A[], int m, int B[], int n) {
if((m + n) % 2 == 1)
return findKthElement(A, m, B, n, (m + n) / 2);
else
return (findKthElement(A, m, B, n, (m + n) / 2) + findKthElement(A, m, B, n, (m + n) / 2 - 1)) / 2;
}
};
可以做的改进:
如果仅仅从算法的性能上来说,还是可以改进的。因为是偶数的时候,需要遍历两次,当然,我们可以直接让findKthElement返回两个数,就是相邻的两个数,这样在偶数情况下,平均他们,在奇数的情况下只取一个就好了。