There are two sorted arrays nums1 and nums2 of size m and n respectively. Find the median of the two sorted arrays. The overall run time complexity should be O(log (m+n)).
一、题目描述
二、解题思路
将原问题转变成一个寻找第k小数的问题(假设两个原序列升序排列),这样中位数实际上是第(m+n)/2小的数。所以只要解决了第k小数的问题,原问题也得以解决。
首先假设数组A和B的元素个数都大于k/2,我们比较A[k/2-1]和B[k/2-1]两个元素,这两个元素分别表示A的第k/2小的元素和B的第k/2小的元素。这两个元素比较共有三种情况:>、<和=。如果A[k/2-1]<B[k/2-1],这表示A[0]到A[k/2-1]的元素都在A和B合并之后的前k小的元素中。换句话说,A[k/2-1]不可能大于两数组合并之后的第k小值,所以我们可以将其抛弃。
证明也很简单,可以采用反证法。假设A[k/2-1]大于合并之后的第k小值,我们不妨假定其为第(k+1)小值。由于A[k/2-1]小于B[k/2-1],所以B[k/2-1]至少是第(k+2)小值。但实际上,在A中至多存在k/2-1个元素小于A[k/2-1],B中也至多存在k/2-1个元素小于A[k/2-1],所以小于A[k/2-1]的元素个数至多有k/2+ k/2-2,小于k,这与A[k/2-1]是第(k+1)的数矛盾。
当A[k/2-1]>B[k/2-1]时存在类似的结论。
当A[k/2-1]=B[k/2-1]时,我们已经找到了第k小的数,也即这个相等的元素,我们将其记为m。由于在A和B中分别有k/2-1个元素小于m,所以m即是第k小的数。(这里可能有人会有疑问,如果k为奇数,则m不是中位数。这里是进行了理想化考虑,在实际代码中略有不同,是先求k/2,然后利用k-k/2获得另一个数。)
通过上面的分析,我们即可以采用递归的方式实现寻找第k小的数。此外我们还需要考虑几个边界条件:
1.如果A或者B为空,则直接返回B[k-1]或者A[k-1];
2.如果k为1,我们只需要返回A[0]和B[0]中的较小值;
3.如果A[k/2-1]=B[k/2-1],返回其中一个;
最终实现的代码为:
#include<iostream>
#include<algorithm>
using namespace std;
class solution{
public:
//求中位数
double findMedianSortedArrays(int A[], int m, int B[], int n){
int total = m + n;
//判断奇偶性
if (total & 0x1)
return find_kth(A, m, B, n, total / 2 + 1);//total为奇数
else
return (find_kth(A, m, B, n, total / 2) + find_kth(A, m, B, n, total / 2 + 1)) / 2.0; //total为偶数
}
private:
//求第k个数
static int find_kth(int A[], int m, int B[], int n, int k){
//假设m总是等于或者小于n
if (m > n) return find_kth(B, n, A, m, k);
if (m == 0) return B[k - 1];
if (k == 1) return min(A[0], B[0]);
//divide k into two parts
int ia = min(k / 2, m), ib = k - ia;
//删除数组A中的前ia个数
if (A[ia - 1] < B[ib - 1])
return find_kth(A + ia, m - ia, B, n, k - ia);
//删除数组B中的前ib个数
else if (A[ia - 1]>B[ib - 1])
return find_kth(A, m, B + ib, n - ib, k - ib);
//A[ia-1]=B[ib-1],则A[ia-1]、B[ib-1]即为第k个数
else
return A[ia - 1];
}
};
int main() {
double result;
solution solution1;
int A[] = {1,4,6,7,9,17};
int B[] = {2,3,5,8,11,14};
result = solution1.findMedianSortedArrays(A, 6, B, 6);
cout << "The median of two sorted arrays is:" << result << endl;
system("pause");
return 0;
}
#include<iostream>
#include<algorithm>
#include<vector>
using namespace std;
class solution{
public:
//求中位数
double findMedianSortedArrays(vector<int>& nums1, vector<int>& nums2){
int m = nums1.size();
int n = nums2.size();
int value1 = find_kth(nums1, m, nums1.begin(), nums2, n, nums2.begin(), (m + n+1 ) / 2);
double result = value1;
//判断奇偶性
if (((m + n) & 0x1) == 0)
{
int value2 = find_kth(nums1, m, nums1.begin(), nums2, n, nums2.begin(), (m + n) / 2 + 1);
result = ((double)value1 + (double)value2) / 2;
}
return result;
}
private:
//求第k个数
static int find_kth(vector<int>& nums1, int m, vector<int>::iterator it1, vector<int>& nums2, int n, vector<int>::iterator it2, int k){
//假设m总是等于或者小于n
if (m > n) return find_kth(nums2, n, it2, nums1, m, it1, k);
if (m == 0) return*(it2 + k - 1);
if (k == 1) return min(*it1, *it2);
//divide k into two parts
int ia = min(k / 2, m), ib = k - ia;
//删除数组A中的前ia个数
if (*(it1 + ia - 1) <= *(it2 + ib - 1))
return find_kth(nums1, m - ia, it1 + ia, nums2, ib, it2, k - ia);
//删除数组B中的前ib个数
else
return find_kth(nums1, ia, it1, nums2, n - ib, it2 + ib, k - ib);
}
};
int main() {
double Median;
solution solution1;
vector<int>numss1={ 1, 4, 6, 7, 9, 17 };
vector<int>numss2= { 2, 3, 5, 8, 11, 14 };
Median = solution1.findMedianSortedArrays(numss1, numss2);
cout << "The median of two sorted arrays is:" << Median<< endl;
system("pause");
return 0;
}