题目:
给定一个长度为 n+1 的数组`nums`,数组中所有的数均在 1∼n 的范围内,其中 n≥1。
请找出数组中任意一个重复的数,但不能修改输入的数组。
数据范围:1≤n≤1000
算法:(分治,抽屉原理)O(nlogn)
抽屉原理:n+1 个苹果放在 n 个抽屉里,那么至少有一个抽屉中会放两个苹果。
用在这个题目中就是,一共有 n+1 个数,每个数的取值范围是1到n,所以至少会有一个数出现两次。
然后我们采用分治的思想,将每个数的取值的区间[1, n]划分成[1, n/2]和[n/2+1, n]两个子区间,然后分别统计两个区间中数的个数。注意这里的区间是指 数的取值范围,而不是 数组下标。
划分之后,左右两个区间里一定至少存在一个区间,区间中数的个数大于区间长度。这个可以用反证法来说明:如果两个区间中数的个数都小于等于区间长度,那么整个区间中数的个数就小于等于n,和有n+1个数矛盾。
因此我们可以把问题划归到左右两个子区间中的一个,而且由于区间中数的个数大于区间长度,根据抽屉原理,在这个子区间中一定存在某个数出现了两次。
依次类推,每次我们可以把区间长度缩小一半,直到区间长度为1时,我们就找到了答案。
复杂度分析
1.时间复杂度:每次会将区间长度缩小一半,一共会缩小 O(logn) 次。每次统计两个子区间中的数时需要遍历整个数组,时间复杂度是 O(n)。所以总时间复杂度是 O(nlogn)。
2.空间复杂度:代码中没有用到额外的数组,所以额外的空间复杂度是 O(1)
代码如下:
class Solution {
public:
int duplicateInArray(vector<int>& nums) {
int left = 1, right = nums.size() - 1;//数组长度为n-1,数据总范围在1~n
while (left < right)//二分法循环边界条件为left<right
{
int mid = left + right >> 1;//找最中间,将数值范围分为两个区间[1,n/2] [n/2+1,n]
//mid=(left+right)/2
int q = 0;//统计区间个数
for (auto x : nums)//找到区间个数大于区间长度的区间
{
q += (x >= left && x <= mid);//计算值在区间[left,mid]中个数,如果在此区间内则加一
}
if (q > mid - left + 1)//如果值在[left,mid]区间中个数大于区间长度,则重复数在此区间内,将此区间进行二分
right = mid;
else//如果[left,mid]中个数小于等于区间长度,那重复数一定在区间[mid+1,right]中
left = mid + 1;
}
return right;//return left;//一直进行区间二分直到区间只有一个数字,则此数字即为重复数
}
};