题目
一个长度为n+1的数组里的所有元素都在1~n的范围内,所有必定存在重复的数字。请找出数组中任意一个重复的数字,但是不能修改输入的数组。
例子
长度为8的数组为{2,3,5,4,3,2,6,7},那么对应输出的重复元素是2或者3。
分析
如果还是用之前的归位法会改变数组,如果用hash表又会带来额外的空间开销。若想依旧保持高效,可以分析元素的个数。n+1的数组里有n个元素势必有重复的元素,所以可以将这n+1个按顺序排好的元素分开,前面是0~m号元素,后面是m+1~n号元素。要是前一半元素的个数大于n/2,问题就出在前面,反之就在后面,然后再按照同样的方法进行划分排查,直到找到重复的元素。,
#include <iostream>
#include <algorithm>
using namespace std;
//这个函数计算数组里有多少元素在制定区间中
int CountNum(int number[],int length,int start,int end){
int sum=0;
for(int i=0;i<length;i++){
if(number[i]>=start && number[i]<=end){
sum++;
}
}
return sum;
}
int main(){
int source[8] = {2,3,5,4,3,2,6,7};
int start=1,end=7;
int mid;
while(end>start){
mid = (end+start)/2;
int sum = CountNum(source,8,start,mid);
//这里我简单的把问题简化,因为只要任意一个重复的元素,所以我默认先从左边排查,如果左边数量不对,就继续在左边找,右边即使也有重复,也不去考虑了。
if(sum>(mid-start+1)){
end = mid;
}else{
start = mid+1;
}
}
cout<<mid; //最终一定会跳出循环,数字一定会有重复
return 0;
}
可是这里只是用时间换了空间,时间复杂度是O(nlogn)。如果采用的是hash表,空间复杂度高,但是时间复杂度会降低。并且这种解决办法会忽略一种可能,就是但重复的数字的个数刚好等于区间的大小,比如:5~7,区间大小是3,如果这个区间中的数字刚好是{5,5,5},这样会无法识别,所以并非所有重复的数字都能找到。