题目描述:
There are two sorted arrays A and B of size m and n respectively. Find the median of the two sorted arrays.
The overall run time complexity should be O(log(m + n)).
分析:
本题更为经典且通用的描述方式为:给定两个有序数组,找出2个数组中所有元素中第k大的元素。
思路1:
最为直观思路就是类似merge sort,将两个数组重新merge成一个新数组,即可得到第k大的值,但是时间复杂度为O(m+n)
思路2:
其实我们仅仅需要第k大的元素,并不需要排序这个操作,可以定义一个cnt,用来表示找到了第m大的元素;
定义两个指针pa,pb分别指向数组A,B的第一个元素,使用merge sort的方式,当A的当前元素小于B的当前元素时:
pa++,cnt++,当*pb<*pa时,pb++,cnt++。最终当m==k时,就得到了第k大的元素。时间复杂度为O(k),但是
当k接近于m+n时,复杂度还是O(m+n).
double findMedianSortedArrays(int A[], int m, int B[], int n)
{
int i=0, j=0, median = m+n;
double prev=0, last=0;
if(median<2)
{
if (m == 0 && n == 0) return 0;
if (m==1) return A[0];
else return B[0];
}
while ( (i+j) <= (median/2) )
{
prev = last;
if (i >= m) //如果A中的元素已经用完,直接取B数组
{
last=B[j];
j++;
}
else if (j>=n) //同上
{
last = A[i];
i++;
}
else if (A[i]<B[j]) //取A[i] 和 B[j] 中较小的
{
last = A[i];
i++;
}
else
{
last=B[j];
j++;
}
}
if ((median & 1) == 0) //偶数个
return (prev + last) / 2.0;
else //奇数个
return last;
}
思路3:
从题目中的要求可知,本体肯定要用到二分查找的思想
我们可以考虑从k入手。
如果每次能够删除一个一定处于第k大元素之前的元素,那么需要进行k次。
但是如果我们每次都能删除一半呢?我们可以利用A,B有序的信息,类似二分查找,降低时间复杂度。
假设A和B的元素个数都大于k/2,我们将A的第k/2个元素和B的第k/2个元素进行比较,有以下三种情况:
A[k/2-1]==B[k/2-1]
A[k/2-1]>B[k/2-1]
A[k/2-1]<B[k/2-1]
如果A[k/2-1]<B[k/2-1],意味着A[0]到A[k/2-1]的元素一定小于A+B第k大的元素。因此可以删除A数组中的这k/2个元素。
同理,如果A[k/2-1]>B[k/2-1],可以删除B数组中的k/2个元素。
当A[k/2-1]==B[k/2-1]时,说明找到了第k大的元素,直接返回。
1. 保持A是短的那一个数组,B是长的
2. 平分k, 一半在A,一半在B (如果A的长度不足K/2,那就pa就指到最后一个)
3. 如果pa的值 < pb的值,那证明第K个数肯定不会出现在pa之前,递归,把A数组pa之前的砍掉,同理递归砍B数组。
4. 递归到 m == 0 (短的数组用完了) 就返回 B[k - 1], 或者k == 1(找第一个数)就返回min(A第一个数,B第一个数)。
实现如下:
double findMedianSortedArrays(int* num1,int num1Size,int*num2,int num2Size){
int m = num1Size;
int n = num2Size;
int total = m + n;
int k = total / 2;
if (total&0x01){//奇数
return find_kth(num1, m, num2, n, k + 1);//返回唯一中间值
}
else{
return (find_kth(num1, m, num2, n, k) + find_kth(num1, m, num2, n, k + 1)) / 2.0;
//返回两个值的平均数
}
}
//找到A,B组合中第k小的值,AB[k-1]
int find_kth(int* A,int m,int* B,int n,int k){
//假设m<=n
if (m > n) return find_kth(B,n,A,m,k);
if (m == 0) return B[k - 1];
if (k == 1) return min(A[0], B[0]);//终止条件
int i_a = min(m, k / 2);
int i_b = k - i_a;
if (A[i_a - 1] < B[i_b - 1]) return find_kth(A+i_a,m-i_a,B,n,k-i_a);
else if (A[i_a - 1]>B[i_b - 1]) return find_kth(A, m, B + i_b, n - i_b, k - i_b);
else
return A[i_a - 1];
}