法一:桶排序思想
- 题目说,每个集合的值都是1 ~ n,一般我们会想到将数组中元素,挨个作为key放入map中,然后遍历1~n从map中获取value,看看谁是0,谁是2.
- 但是我们可以直接再创建一个数组,长度为n+1,用下标来代表数字,将1~n的个数,放入桶中。比如遍历nums数组是,当前元素是1,就放入下标为1的桶中,此时这个桶有1个元素,当我们有遍历到1时,再次放入下标为1的桶,此时这个桶有2个元素。
class Solution {
public int[] findErrorNums(int[] nums) {
int[] ans = new int[2];
int[] bucket = new int[nums.length + 1];
for (int num : nums) bucket[num]++;
for (int i = 1; i <= nums.length; i++) {
if (bucket[i] == 0) ans[1] = i;
else if (bucket[i] == 2) ans[0] = i;
if (ans[0] != 0 && ans[1] != 0) break;
}
return ans;
}
}
法二:位运算
- 每个集合包含的元素必然为1 ~ n。例如n = 4,那么集合可以是[1,2,3,4],[1,2,4,3],[4,3,2,1]等等,但是必然包含1,2,3,4,也就是1~n这n个数。
- 但是题目说了,每个集合都发生了错误,有一个数字重复,而另一个数字消失了,比如[1,2,2,4], 正确的应该是包含1,2,3,4这4个数,但是现在少了一个3.
请在下面文章中,了解一下异或和补码的
- 集合中保存的都是1~n的正数,计算机保存也都是补码,也就是符号位为0表示正数
- 正数的补码和源码是一样的,例如1 =
0
,000 0000 0000 0000 0000 0000 0000 0001 (以32位进行保存) - 负数的补码和源码的区别是,
符号位和最右边的1不变
,这两个不变的二进制位中间的其余数值位
全部取反
- 原码:例如-1=
1
,000 0000 0000 0000 0000 0000 0000 0001 - 补码:例如-1=
1
,111 1111 1111 1111 1111 1111 1111 1111
- 我们现在有了1和-1的补码。
- 1 =
0
,000 0000 0000 0000 0000 0000 0000 0001 - -1=
1
,111 1111 1111 1111 1111 1111 1111 1111 - 我们发现,除了最右边的1以外,这个1左边所有的数,都是不同的。
- 如果此时我执行1与-1 也就是 1 & (-1)
我会得到0
,000 0000 0000 0000 0000 0000 0000 0001,也就是除了最右边的1以外,其余全是0. 这样我就得到了这个数的最低位的那个1.也就是我得到了这个数,最右边的一个二进制1的位置。并且其余二进制位全是0
- 得到它有什么用呢?作用就是简化判断条件,让我们只需要用if考虑两种情况,而不是无数种。
- 0 & 任何数都是0,只有1 & 1 才能唯一的 = 1. 这就是它的作用。对于最终得到的只有最右1,其余全为0的二进制串lowbit =
0
,000 0000 0000 0000 0000 0000 0000 0001来说,只有遇到一个同样1在最右边的数才会不为0,否则它必然为0. - 它让任何数与其相与只有两种结果,要么为1,要么为0.而不是各种值。
- 例如 8 =
0
,000 0000 0000 0000 0000 0000 0000 1000 - 和lowbit相与
0
,000 0000 0000 0000 0000 0000 0000 0001 - 结果为==
0
,000 0000 0000 0000 0000 0000 0000 0000
- 如果不进行只取最右边1的操作,直接随便两个数呢?
8的二进制补码为:0000 … 1000
9的二进制补码为:0000 … 1001
异或结果为:==== 0000 … 1000 这个值=8,不同的数,还有无穷多种结果
请你告诉我,我该如何写if语句,描述这大量的结果呢?我们当然希望只有0或者1两种状态,以方便我们写if语句。所以这就是只保留最右边的1,其余全部为0的作用。
- 案例的补码
- 1的补码:
0
,000 0000 0000 0000 0000 0000 0000 0001 - 2的补码:
0
,000 0000 0000 0000 0000 0000 0000 0010 - 3的补码:
0
,000 0000 0000 0000 0000 0000 0000 0011 - 4的补码:
0
,000 0000 0000 0000 0000 0000 0000 0100
- 找到,缺少的数和重复的数的异或结果,记为xor。
- 整体异或消除重复的元素:1⊕2⊕2⊕4 = 1⊕0⊕4 = 1⊕4. 这里利用了异或的结合律和异或规律(相同的数异或 = 0)
- 和1~n异或获得重复的数和缺少的数的异或。1⊕4⊕1⊕2⊕3⊕4 = (1⊕1)⊕(4⊕4)⊕(2⊕3) = 2⊕3此时就是重复的数2,和缺少的数3的异或结果。记为xor
- 找到xor这个异或结果的最低位1. 上面说过,这个操作就是将if判断简化为只需要判断是0还是1,而不是无穷多种.
xor & (-xor) = 只保留最低位的1,其余全为0. 记为lowbit = 0
,000 0000 0000 0000 0000 0000 0000 0001。这里很巧,这个例子的lowbit正好是1的补码。
- 这道题需要两个结果,一个是缺少的数,另一个是重复的数
我们这里常用的套路就是分成两组计算。因为我们上面分析过,任何数和lowbit相与,只有0和1两种结果。我们将与lowbit相与为0分为一组,让它和num1进行异或。与lowbit相与为1的分为另一组,让它和num2进行异或。
- nums数组中的值[1,2,2,4],依次和lowbit进行分组异或. 可以获得两个没有任何问题的数。也就是既不是丢失的,也不是重复的。
- 1&lowbit = 1, num2 ^=1 = 0⊕1=1. 首先是1这个数,与lowbit相与,发现值为1,将其分为1组,和num2进行异或
- 2&lowbit = 0, num1 ^=2 = 0⊕2=2. 然后2这个数,与lowbit相与,发现值为0,分到0组,和num1异或
- 2&lowbit = 0, num1 ^=2 = 2⊕2 = 0. 然后又是2这个数,与lowbit相与,发现值为0,0组异或
- 4&lowbit = 0, num1 ^=4 = 0⊕4 = 4. 最后是4这个数,与lowbit相与,发现值为0,0组异或
- 最终,num1 = 4,num2 = 1
- 然后和1~n,也就是1,2,3,4进行再次分组异或,找到两个有问题的数。也就是重复的,和丢失的
- 1&lowbit = 1, num2 ^=1 = 1⊕1 = 0.
- 2&lowbit = 0, num1 ^=2 = 4⊕2 = 6. 这个6是二进制转换过来的,大家可以自己用代码算
- 3&lowbit = 1, num2 ^=3 = 0⊕3 = 3.
- 4&lowbit = 0, num1 ^=4 = 6⊕4 = 2.
- 最终,num1 = 2,num2 = 3。但是到底谁是丢失的,谁是重复的,我们也不知道
- 再次进行nums数组[1,2,2,4]的遍历比对,看看num1是否保存的是重复的值,如果是,num1作为重复值,num2作为缺失值返回。否则num1作为缺失值,num2作为重复值返回
class Solution {
public int[] findErrorNums(int[] nums) {
int n = nums.length;
int xor = 0;
for(int num:nums) xor ^= num;
for(int i = 1;i<=n;i++) xor^=i;
int lowbit = xor & (-xor);
int num1 = 0, num2 = 0;
for(int num:nums){
if((num & lowbit)==0) num1^=num;
else num2 ^= num;
}
for(int i = 1;i<=n;i++){
if((i & lowbit)==0) num1^=i;
else num2^=i;
}
for(int num:nums){
if(num==num1) return new int[]{num1,num2};
}
return new int[]{num2,num1};
}
}