寻找两个有序数组中的第K个数或者中位数

41 篇文章 1 订阅


假设有长度分为为M和N的两个升序数组A和B,在A和B两个数组中查找第K大的数,即将A和B按升序合并后的第K个数。


解法一:

使用两个指针指向A和B的开头,很容易在O(M+N)的时间内完成,此算法略过。


解法二:

使用二分的方法。算法思想在代码注释中


#include <iostream>
#include <string.h>
#include <stdlib.h>
using namespace std;



//Notice : K > 0
int FindKthElm(int A[], int aBeg, int aEnd, int B[], int bBeg, int bEnd, int k)
{
	if (aBeg > aEnd)
	{
		return B[bBeg + k - 1];
	}
	if (bBeg > bEnd)
	{
		return A[aBeg + k - 1];
	}
	
	//取中间位置
	int aMid = aBeg + (aEnd - aBeg)/2;	
	int bMid = bBeg + (bEnd - bBeg)/2;
	
	//从A和B的开始位置到两个数组中间位置的元素个数
	int halfLen = aMid - aBeg + bMid - bBeg + 2;
	
	if (A[aMid] < B[bMid])
	{
		if (halfLen > k)
		{
			// 此时在合并的数组中A[aBeg...aMid]和元素一定在B[bMid]的左侧,
			// 即此时第k大的元素一定比B[bMid]这个元素小(严格来说不大于)
			// 故以后没有必要搜索 B[bMid...bEnd]这些元素
			return FindKthElm(A, aBeg, aEnd, B, bBeg, bMid - 1, k);
		}
		else
		{
			// 此时在合并的数组中A[aBeg...aMid]元素一定在B[bMid]的左侧,
			// 所以前K个元素中一定包含A[aBeg...aMid](可以使用反证法来证明这点)。
			// 但是无法判断A[amid+1...aEnd]与B[bBeg...bEnd]之间的关系,帮需要对他们进行判断
			// 此时K就剩下除去A[aBeg...aMid]这些元素,个数为k - (aMid - aBeg + 1)
			return FindKthElm(A, aMid + 1, aEnd, B, bBeg, bEnd, k - (aMid - aBeg + 1));
		}
	}
	else
	{
		//注释与上面相似
		if (halfLen > k)
		{
			return FindKthElm(A, aBeg, aMid - 1, B, bBeg, bEnd, k);
		}
		else
		{
			return FindKthElm(A, aBeg, aEnd, B, bMid + 1, bEnd, k - (bMid - bBeg + 1));
		}
	}
}


int main()
{
	const int ALen = 11;
	const int BLen = 5;
	
	int apos = 0;
	int bpos = 0;
	int A[ALen];
	int B[ALen];
	
	//生成两个递增数组A 和 B
	for (int i = 1; i <= ALen + BLen; ++i)
	{
		if (apos >= ALen)
		{
			B[bpos++] = i;
		}
		else if (bpos >= BLen)
		{
			A[apos++] = i;
		}
		else
		{
			if (rand()%2 == 1)
			{
				A[apos++] = i;
			}
			else
			{
				B[bpos++] = i;
			}
		}
	}
	
	//输出A和B的内容
	for (int i = 0; i < ALen; ++i)
	{
		cout <<A[i] <<" ";
	}
	cout <<endl;
	for (int i = 0; i < BLen; ++i)
	{
		cout <<B[i] <<" ";
	}
	cout <<endl;
	
	//验证每个K是不是正解
	for (int i = 1; i <= ALen + BLen; ++i)
	{
		cout << i <<" : "<<FindKthElm(A, 0 , ALen - 1, B, 0 , BLen - 1, i)<<endl;
	}
	
	return 0;
}

给定两个有序数组,假设数组 `nums1` 的长度为 `m`,数组 `nums2` 的长度为 `n`。为了方便起见,假设 `m ≤ n`。要求解这两个有序数组中位数或第 `k` 小的元素,可以采用以下两种方法。 ## 方法一:归并排序 这种方法的思路很简单,就是将两个有序数组归并成一个有序数组,然后再根据数组长度和 k 的值确定中位数或第 k 小的元素。具体步骤如下: 1. 定义两个指针 `p1` 和 `p2`,分别指向数组 `nums1` 和 `nums2` 的起始位置。 2. 定义一个新数组 `nums3`,用于存放归并后的有序数组。 3. 循环执行以下步骤,直到 `nums3` 有 `k` 个元素: 1. 比较 `nums1[p1]` 和 `nums2[p2]` 的大小,将较小的元素加入 `nums3` 。 2. 将指向较小元素的指针后移一位。 4. 如果 `m + n` 是奇,则 `nums3[(m+n)/2]` 就是中位数;否则 `nums3[(m+n)/2-1]` 和 `nums3[(m+n)/2]` 的平均值就是中位数。如果要求第 k 小的元素,则返回 `nums3[k-1]`。 时间杂度为 $O(m+n)$。 ## 方法二:二分查找 这种方法的思路比较巧妙,其核心思想是在两个有序数组找到第 k 小的元素,假设这个元素在数组 `nums1` 的位置是 `i`,在数组 `nums2` 的位置是 `j`。那么有以下两种情况: 1. 如果 `nums1[i] < nums2[j]`,则数组 `nums1[0...i]` 的所有元素都是第 k 小的元素的候选元素,因为这些元素都小于 `nums2[j]`,而 `nums2[0...j]` 的所有元素都不可能是第 k 小的元素,因为这些元素都小于 `nums1[i]`。 2. 如果 `nums1[i] >= nums2[j]`,则数组 `nums2[0...j]` 的所有元素都是第 k 小的元素的候选元素,因为这些元素都小于 `nums1[i]`,而 `nums1[0...i]` 的所有元素都不可能是第 k 小的元素,因为这些元素都小于 `nums2[j]`。 具体步骤如下: 1. 定义两个指针 `p1` 和 `p2`,分别指向数组 `nums1` 和 `nums2` 的起始位置。 2. 循环执行以下步骤,直到找到第 k 小的元素: 1. 如果 `p1 >= m`,说明数组 `nums1` 已经没有元素可以参与比较,直接返回 `nums2[p2+k-1]`。 2. 如果 `p2 >= n`,说明数组 `nums2` 已经没有元素可以参与比较,直接返回 `nums1[p1+k-1]`。 3. 如果 `k == 1`,直接返回 `min(nums1[p1], nums2[p2])`。 4. 比较 `nums1[p1+k/2-1]` 和 `nums2[p2+k/2-1]` 的大小,如果前者小于等于后者,则说明 `nums1[0...k/2-1]` 的所有元素都小于等于第 k 小的元素,可以把这些元素全部排除掉,更新 `k` 的值为原来的一半,并将指向 `nums1` 的指针后移 `k/2` 个位置;否则说明 `nums2[0...k/2-1]` 的所有元素都小于等于第 k 小的元素,可以把这些元素全部排除掉,更新 `k` 的值为原来的一半,并将指向 `nums2` 的指针后移 `k/2` 个位置。 3. 如果要求中位数,则返回第 `(m+n)/2` 小的元素和第 `(m+n)/2+1` 小的元素的平均值;如果要求第 k 小的元素,则返回第 k 小的元素。 时间杂度为 $O(\log(m+n))$。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值