题目:在一个长度为n的数组中所有数字都在0~n-1的范围内,数组中某些数组是重复的,但是不知道有多少数字重复,也不知道重复了几次。请在数组中找出任意重复的一个数字。例如数组长度为7,{2,3,1,0,2,5,3},对应输出的数字应该是2或者3
解决方法有很多,最容易理解的思路是把数组排序,完成后只要再扫描一次数组就可以确认有没有重复数字存在,也可以把所有重复数字找出。排序最快的时间复杂度是O(NlogN)。
另一种方式是在扫描的时候用哈希表来存储数组的每一个元素,当碰到数组元素与哈希表中一致时,可以确认数字重复。这样的方法时间复杂度是O(N),但是需要临时空间O(N)。
以下用一个临时数组来充当哈希表,演示这个算法:
//如果数组存在重复元素,返回其值
//如果不存在,返回-1
int CheckDuplicateArray(int array[], int len){
//确认输入正确
if(array==nullptr||len<=0) return -1;
for(int i = 0; i < len; ++i){
if(array[i]<0||array[i]>len-1) return -1;
}
int temp[len];
for(int i = 0; i < len; i++){
temp[i] = -1;
}
for(int i = 0; i < len; i++){
if(temp[array[i]]!=-1) return array[i];
temp[array[i]] = array[i];
}
return -1;
}
现在来看另外一个方法。注意到数组的元素是0~n-1,当数组有序时,数组的下标等于数组元素。因此可以用以下方法:从头开始扫描数组,当数组元素m与下标值i相等时,扫描下一个元素。如果不相等,比较元素m与下标为m的元素,如果相等则已经找到相同的元素,否则将元素m与下标为m的元素交换。
以{2,3,1,0,2,5,3}这个数组为例,第一个元素是2,下标为2的元素为0,两者交换后{1,3,2,0,2,5,3}。第一个元素变为1,下标为1的元素是3,交换后{3,1,2,0,2,5,3},第一个元素为3,下标为3的元素是0,交换后{0,1,2,3,2,5,3},接下来下标为1,2,3的元素值都与下标一致,不需要操作。之后下标为4的元素为2,下标为2的元素也为2,两者相等,因此找到了重复元素2。
以下是代码实现:
int CheckDuplicateArray(int array[], int len){
if(array==nullptr||len<=0) return -1;
for(int i = 0; i < len; ++i){
if(array[i]<0||array[i]>len-1) return -1;
}
for(int i = 0; i < len; ++i){
while(array[i]!=i){
if(array[i]==array[array[i]]) return array[i];
swap(array[i],array[array[i]]);
}
}
return -1;
}
因为每个元素最多交换两次就可以放置到正确位置,因此时间复杂度为O(N),只有在交换元素的时候需要O(1)的空间。
测试用例:
- 数组中包含1个或多个重复数字
- 数组不包含重复数字
- 无效数组(数组为空指针,数组包含0~N-1以外的元素)。