在两个数组中找到中位数。
There are two sorted arrays A and B of size m and n respectively. Find the median of the two sorted arrays.
Given A=[1,2,3,4,5,6]
and B=[2,3,4,5]
, the median is 3.5
.
Given A=[1,2,3]
and B=[4,5]
, the median is 3
.
The overall run time complexity should be O(log (m+n))
.
public double findMedianSortedArrays(int[] A, int[] B) {
int len = A.length + B.length;
if(len % 2 == 0) {
return (findKth(A, 0, B, 0, len/2) + findKth(A, 0, B, 0, len/2 + 1) ) / 2.0;
} else {
return findKth(A,0,B,0,len/2 + 1);
}
}
private int findKth(int[] A, int A_start, int[] B, int B_start, int k) {
if(A_start >= A.length) {
return B[B_start + k - 1];
}
if(B_start >= B.length) {
return A[A_start + k - 1];
}
if(k == 1) {
return Math.min(A[A_start], B[B_start]);
}
int A_key = A_start + k/2 - 1 < A.length ? A[A_start + k/2 - 1] : Integer.MAX_VALUE;
int B_key = B_start + k/2 - 1 < B.length ? B[B_start + k/2 - 1] : Integer.MAX_VALUE;
if(A_key < B_key) {
return findKth(A, A_start + k/2, B, B_start, k - k / 2);
} else {
return findKth(A, A_start, B, B_start + k / 2, k - k / 2);
}
}
思路:
实现O(log(m+N))的时间复杂度要采用二分排除法。
找中位数,就是找排序后的第K个数字。考虑前K个数字是由两个数组里的数构成,利用二分排除逐步逼近K。
前K个数字中,每次在两个数组找到前K/2个数字,并在一个数组中排除掉(认为这些数构成了排序后的前K/2个数)。
举例说明:
A = 1 2 3 4 5 6
B = 2 3 4 5
排序后C:1 2 2 3 3 4 4 5 5 6
中位数是第5个和第6个数的平均数。
第一步:
以找第5个数为例,k = 5,mid = k/2 -1 = 1 是前k个数mid。
A[mid] = 2, B[mid] = 3
所以A[mid] < B[mid],也就是说A中mid之前的数都比B中mid之前的数小,所以A[mid]之前的数都处于C中前5个数之中,并且是前两个C[0],C[1]。
于是可以排除掉A[mid]之前的数不在考虑,只看剩下的数。k= k - k/2 = 3。
第二步:
A = 1 2 3 4 5 6
B = 2 3 4 5
C = 1 2 2 3 3 4 4 5 6
现在要找的是剩下数字的第3个数,k = 3,mid = 1。
A[mid] = 4,B[mid] = 3
A[mid] > B[mid],故B中mid之前的数处于C中,并且是前两个c[2],c[3]。
排除后,k = k - k / 2 = 1
第三步:
A = 1 2 3 4 5 6
B = 2 3 4 5
C = 1 2 2 3 3 4 4 5 6