题目分析
1. 题目要求在两个已经排好序的序列中找到中位数,其实可以转化成在两个已经排好序的数列中找到第 (Len / 2 + 1) 或 ((Len / 2 + 1 )大数 + (Len / 2)大数) / 2的题目,也就是在排好序的数列中找第K大数的题目。
2. 题目本身的要求不复杂,算法也比较容易得到,就是有点类似于二分查找的题目。
主要是因为一个结论
数列A,B,找第 k 大数,
如果A[k / 2 - 1] > B[k / 2 - 1],则第 k 大的数不可能出现在B的前 k / 2 个数中。
证明也比较简单,由反证法
如果在B的前 k / 2 个数中存在第 k 大的数为B[i],则A[k / 2 - 1] > B[k / 2 - 1] >= B[i],B中有i - 1< k / 2 - 1个数比B[i]小<,A中至多存在k / 2 - 1个数比B[i]小,因此A B中至多总共有 (k / 2 - 1) + (k / 2 - 1) = k - 2 个数比B[i]小,与B[i]是A B中的第 k 大的数矛盾,得证。
3. 然后不断迭代删掉不可能出现第K大数的部分就可以了,我使用加offset偏移量来删掉的方式做的,因为删掉的部分一定出现在开头,而且是连续的,这样可以避免在数组中删除数带来的开销。
3. 但这道题目主要比较坑的是边界条件的处理,例如如果k / 2 大于某个数组的总长,就不能删掉 k / 2个值,必须删掉小数组总长对应的值。还有一些奇数偶数的问题也是比较坑,改的比较多,因此我的代码可能是CSDN写这题最难看的代码了。。。
class Solution {
public:
double findKth(vector<int>& a, vector<int>&b, int k, int aOffset, int bOffset) {
int aLen = a.size();
int bLen = b.size();
if (aLen > bLen) return findKth(b, a, k, bOffset, aOffset);
if (aLen - aOffset == 0) return b[bOffset + k - 1];
if (bLen - bOffset == 0) return a[aOffset + k - 1];
if (k == 1) return a[aOffset] > b[bOffset] ? b[bOffset] : a[aOffset];
int cut = k / 2;
int cuta = aOffset + (cut > (aLen - aOffset)?aLen - aOffset:cut);
int cutb = bOffset + (k - (cuta-aOffset));
if (a[cuta - 1] > b[cutb - 1]) return findKth(a, b, k - (cutb- bOffset), aOffset, bOffset + (cutb - bOffset));
if (a[cuta - 1] < b[cutb - 1]) return findKth(a, b, k - (cuta - aOffset), cuta, bOffset);
if (a[cuta - 1] == b[cutb - 1]) return a[cuta - 1];
}
double findMedianSortedArrays(vector<int>& nums1, vector<int>& nums2) {
int total = (nums1.size() + nums2.size());
if (total & 0x1)
return findKth(nums1, nums2, total / 2 + 1, 0, 0);
else return (findKth(nums1, nums2, total / 2, 0, 0)
+ findKth(nums1, nums2, total / 2 + 1, 0, 0)) / 2;
}
};