汉明距离指的是,两个(相同长度)字对应位不同的位的数量,我们以d(x,y)表示两个字x,y之间的汉明距离。
就是他们异或后的汉明重量(有多少个位不同)。
希望可以用最简单的话讲明白。
int n = x ^ y;
第一步: n = (n & 0x55555555) + ( (n>>1) & 0x55555555 );
0x55555555 -> 0101 0101 0101 0101 0101 0101 0101 0101
让n和它做与运算,实际上是计算奇数位上有多少个1(1 or 0) => (n & 0x55555555)
让n右移一位与它做与运算,实际上是为了计算偶数位上有多少个1(1 or 0) => (n>>1) & 0x55555555
所以我们求和后就 每两位就是表示刚才奇偶位上的1个数和。
那么剩下的工作就很简单了,我只需要把这每两位的信息分别取出来,求和就是结果
0x3 => 0011
假设 n = 1001 就是前两位 有2个1 后两位有一个1
通过移位来提取10 和 01的信息
n & 0x3 就是 0001
(n>>2) & 0x3 就是0010
就和就完事了,后面道理是一样的,如果你牛逼也可以在后面的步骤做一些优化,但是也就是少个一两次运算吧
于是我们开始迭代两两求和,那么总数会减少2分之一,也就是后面就是每4位表示当前4为1的个数,每8位表示当前8位1的个数知道16,32位就是结果
n = (n & 0x33333333) + ( (n>>2) & 0x33333333 );
n = (n & 0x0f0f0f0f) + ( (n>>4) & 0x0f0f0f0f );
n = (n & 0x00ff00ff) + ( (n>>8) & 0x00ff00ff );
n = (n & 0x0000ffff) + ( (n>>16)& 0x0000ffff );