快速在数组中查找重复和遗失的元素
问题
给定集合 Z = { x 1 , x 2 , . . . , x n } Z = \{ x_1, x_2, ..., x_n \} Z={x1,x2,...,xn}。集合内包含 n n n个元素,每个元素都是数字。对于另一个集合 A A A,它缺失了 Z Z Z中的一个元素,并重复了一个元素。
希望设计一个算法,找出重复和缺失的元素。空间复杂度 O ( 1 ) O(1) O(1),时间复杂度 O ( n ) O(n) O(n)。
分析
本题有两种解法,一个用到了数学公式求解,一个是异或运算求解。为描述方便,我们假设重复的元素为 x i x_i xi,缺失的元素为 x j x_j xj。其中 1 ≤ i ≤ n , 1 ≤ j ≤ n 1 \leq i \leq n, 1 \leq j \leq n 1≤i≤n,1≤j≤n。
解法1
思路
把 Z Z Z中的元素求和,记为 s u m z sum_z sumz。把 A A A中的元素求和,记为 s u m a sum_a suma。把 Z Z Z中的元素平方求和,记为 s u m z 2 sum_z^2 sumz2。把 A A A中的元素平方求和,记为 s u m a 2 sum_a^2 suma2。
S
1
=
s
u
m
z
−
s
u
m
a
=
x
j
−
x
i
S
2
=
s
u
m
z
2
−
s
u
m
a
2
=
x
j
2
−
x
i
2
S_1 = sum_z - sum_a = x_j - x_i \\ S_2 = sum_z^2 -sum_a^2 = x_j^2 - x_i^2\\
S1=sumz−suma=xj−xiS2=sumz2−suma2=xj2−xi2
我们有 S 3 = S 2 S 1 = x j + x i S_3 = \frac{S_2}{S_1} = x_j + x_i S3=S1S2=xj+xi。所以 x j = S 3 + S 1 2 x_j = \frac{S_3 + S_1}{2} xj=2S3+S1 , x i = S 3 − S 1 2 x_i = \frac{S_3 - S_1}{2} xi=2S3−S1。
代码
public class FindDuplicateAndMissingElements{
private int[] Z;
private int[] A;
private int missingElement = 0;
private int duplicateElement = 0;
public FindDuplicateAndMissingElements(int[] Z, int[] A){
this.Z = Z;
this.A = A;
}
private void findElements(){
int sumZ = 0, sumA = 0;
int sumZ2 = 0, sumA2 = 0;
for (int i = 0; i < Z.length; i++) {
sumZ += Z[i];
sumA += A[i];
sumZ2 += Z[i] * Z[i];
sumA2 += A[i] * A[i];
}
int s1 = sumZ - sumA;
int s2 = sumZ2 - sumA2;
int s3 = s2 / s1;
missingElement = (s1 + s2) / 2;
duplicateElement = (s2 - s1) / 2;
}
public int getMissingElement() {
return missingElement;
}
public int getDuplicateElement() {
return duplicateElement;
}
}
解法2
思路
把集合 A A A中所有元素异或,得到 x o r A xor_A xorA。把集合 Z Z Z中所有元素异或,得到 x o r Z xor_Z xorZ。那么记 t m p = x o r A ⨁ x o r Z = x i ⨁ x j tmp = xor_A \bigoplus xor_Z = x_i \bigoplus x_j tmp=xorA⨁xorZ=xi⨁xj。
因为 x i x_i xi与 x j x_j xj是两个不同的元素,它们异或结果一定不为零。那么转化为二进制的话,一定在某一位上为1。遍历集合 Z Z Z,把集合内所有在这一位上都为1的元素拿出来,组成新的集合 C = { x i 1 , x i 2 , . . . , x i m } C = \{ x_{i1}, x_{i2}, ..., x_{im} \} C={xi1,xi2,...,xim}。对集合 A A A做一样的操作,把所有在这一位上都为1的元素拿出来,组成新的集合 D = { x t 1 , x t 2 , . . . , x t m } D = \{ x_{t1}, x_{t2}, ... , x_{tm} \} D={xt1,xt2,...,xtm}。 把 C C C的所有元素求得异或和,记为 x o r C xor_C xorC。 把 D D D的所有元素求得异或和,记为 x o r D xor_D xorD。记 x = x o r C ⨁ x o r D x = xor_C \bigoplus xor_D x=xorC⨁xorD, y = t m p ⨁ x y = tmp \bigoplus x y=tmp⨁x。
遍历一遍集合 A A A,假如 x x x出现在集合 A A A,那么 x x x是重复的元素, y y y是缺失的元素。假如 y y y出现在集合 A A A,那么 y y y是重复的元素, x x x是缺失的元素。
代码
public class FindDuplicateAndMissingElements{
private int[] Z;
private int[] A;
private int missingElement = 0;
private int duplicateElement = 0;
public FindDuplicateAndMissingElements(int[] Z, int[] A){
this.Z = Z;
this.A = A;
}
private void findElements(){
int xorZ = 0, xorA = 0;
for (int i = 0; i < Z.lenght; i++){
xorA = xorA ^ A[i];
xorZ = xorZ ^ Z[i];
}
int tmp = xorA ^ xorZ;
int mark = 1;
int i = 0;
while (true){
mark = mark << i;
if ((tmp) & mark != 0) {
break;
}
i++;
}
xorA = 0;
xorZ = 0;
for (int i = 0; i < Z.length; i++) {
if ((A[i] & mark) != 0) {
xorA = xorA ^ A[i];
}
if ((Z[i] & mark) != 0) {
xorZ = xorZ ^ Z[i];
}
}
int x = xorA ^ xorZ;
int y = tmp ^ x;
boolean flag = false;
for (int i = 0; i < Z.length; i++) {
if (A[i] == x) {
duplicateElement = x;
missingElement = y;
flag = true;
break;
}
}
if (flag == false) {
duplicateElement = y;
missingElement = x;
}
}
public int getMissingElement() {
return missingElement;
}
public int getDuplicateElement() {
return duplicateElement;
}
}