剑指03 题目二 不修改数组找出重复的数字
原题目
在一个长度为n+1的数组里的所有数字都在1~n范围内,所以数组中至少有一个数字重复。找出一个重复的数字但不能修改原数组
示例:
输入:{2,3,5,4,3,2,6,7}
输出:2或3
自己的第一遍解法
本题是这道题的延伸,剑指 03 数组中重复的数字
既然给出了数组长度,第一个念头还是想到哈希法,与上面题中代码基本一致,需要修改的就是构造的哈希表大小应为n+1
,并且因为范围在1~n内,所以哈希表的第一个位置必然是0,代码如下:
class Solution
{
public:
int fingRepeatNumberWithoutChangeVector(vector<int> nums)
{
int n = nums.size();//初始化返回结果,即重复的数字
int res = INT32_MAX;//哈希表
vector<int> hashTable(n + 1, 0); //延伸的主要差异
for (auto it = nums.begin(); it != nums.end(); ++it)
{
++hashTable[*it];//比如*it是2,则将哈希表hashTable[2]做+1
if (hashTable[*it] > 1)//哈希表中的元素一旦>1(==2)肯定就是出现重复元素了
{
res = *it;
break;
}
}
return res;
}
};
复杂度分析
使用辅助空间,空间复杂度为O(n)
其他好的解法
剑指书上给了一种二分法方案。比如要是没有重复数字,在[1, n]的范围内就只有n个数。假设m是[1, n]中间的数,统计[1, m]内数字(1、2、… m)在数组中的出现的次数count,如果count > m,说明[1, m]内存在重复数字;再将[1, m]分成两份,统计每份数字在数组中出现的次数,如此到最后两个数,分别统计这两个数在数组中出现的次数。
亮点:
传统的二分法是针对有序数组来使用的,但是这个二分法是通过查询已知范围的数组元素在乱序数组中出现的次数为前提使用的。
//统计传入区间[start, end]的数字在传入数组中出现的次数,返回该次数
int countRange(const int* numbers, int length, int start, int end)
{
if (numbers == nullptr) //对输入的安全检查
return 0;
int count = 0;
for (int i = 0; i < length; i++) //遍历数组,统计范围在1~m的数字出现次数
if (numbers[i] >= start && numbers[i] <= end) // 1~m左闭右闭区间
++count;
return count;
}
//返回重复数字
int getDuplication(const int* numbers, int length)
{
if (numbers == nullptr || length <= 0) //对输入的安全检查
return -1;
int start = 1;
int end = length - 1;
while (end>=start)
{
int middle = ((end - start) >> 1) + start;
int count = countRange(numbers, length, start, middle);
if (start == end) //对于一个区间内最后一个小区间(即单个数字),统计该数字在数组中出现的次数
{
if (count > 1) //该数字出现次数多于一次
return start;
else //该数字只出现过一次
break;
}
if (count > middle - start + 1) //重复数字在左区间,切换终点到中间
end = middle;
else //重复数字在右区间,切换起点到中间+1,因为是左闭右闭区间
start = middle + 1;
}
return -1; //处理异常情况,正确情况的返回值已经在上面if语句中,这里必须有一个显式return
}
测试用例
以往笔者的测试用例都很基础,只实现了特定功能,没有考虑对异常情况(无效输入、与题目要求相反的的输入)的处理。剑指书上列的三种测试用例都值得借鉴。
- 题目本身要求:长度n+1的数组中包含一个重复元素
- 与题目条件相反:数组中不包含重复元素
- 无效输入:输入空数组(空指针)、数组长度<0(只在传入int*形式的数组时,该种测试有意义)
获得的思考
撸代码之前一定要先构造测试用例,增加鲁棒性,再完成基本要求后考虑其他异常情况。