Hamming Distance汉明距离

引子

第一次听说汉明距离来源于一次面试,当时问了个题目:
已知一个无符号的二进制整数n,int长度,求二进制中1的个数

方法1:直接数

最简单的方法,挨个挨个数,声明一个计数变量,当尾数为1时加1,然后把n右移1位,直到该数为0为止
int Method01(int n)
{
	int count(0);	//声明计数变量
	while (n != 0)
	{
		count += n & 1;
		n >>= 1;	//右移
	}
	return count;
}

方法2:n和n-1相与最低位永远为0

直接数这种粗暴的方法肯定不是效率低下的,把每一位都考虑到,而没有进行筛选。 
这里是只统计1的个数,那怎样把1一个一个取出来呢?既能统计到个数,也要不能影响到其他未统计的1。考虑这样一个规律:n和n-1相与,最低位始终为0。 
 

e.g.: 

n0101 1000
n - 10101 0111
n & (n - 1)0101 0000

这样的话,最后一个1已经全部换成0了,而其他1也没有产生影响。
int Method02(int n)
{
	int count(0);
	while (n != 0)
	{
		n &= n - 1;
		++count;
	}
	return count;
}
这个方法在n的大多数据位为0时,效率最高,因为只统计了一的次数。 
引申1:如果判断一个数为2的幂次方:(n > 0) && ((n & (n - 1)) == 0)
引申2:如果n的大多数据位为1时,可以将n &= n - 1替换为 n | (n - 1) = 0xFF

方法3:Hamming Weight

采用分冶的思想,为了统计4个字节的中有1的个数,将数据的相邻两位分成一组,统计出每组中含有1的个数:
比相邻的两位x=10构成一组,要统计这组含有1的个数,低位中1的个数:x & 01,高位中1的个数(x >> 1) & 01。这里n为4byte,则表示为n & 0x55555555 + (x >> 1) & 0x55555555。

将上一步计算的结果保存到n中,再将每相邻两组即4位构成新一组,再进行计算,如此只须做4次运算,即可得出最终结果。

e.g.:  以8bit为例

n = 0110 1100

0x55 = 0101 0101

---------------------------------------------------------------------------------------------------------------------

n = |0 1|1 0|1 1|0 0|                    将n按每两位分成一组

----------------------------------------------------------------------------------------------------------------------

   |0 1|0 0|0 1|0 0|                                  n与0x55=0101 0101相与的结果:低位中为1的个数

+ |0 0|0 1|0 1|0 0|                                  n>>1与0x55=0101 0101相与的结果:高位中为1的个数

= |0 1|0 1|1 0|0 0|                                  将两个结果相加

= |0 1 0 1|1 0 0 0|                                  4个一组

----------------------------------------------------------------------------------------------------------------------

  |0 0 0 1|0 0 0 0|                                    n与0x33=0011 0011相与的结果

+|0 0 0 1|0 0 1 0|                                    n>>2与0x33=0011 0011相与的结果

=|0 0 1 0|0 0 1 0|                                    相加

=|0 0 1 0 0 0 1 0|                                    8个一组

----------------------------------------------------------------------------------------------------------------------

  |0 0 0 0 0 0 1 0|                                    n与0x0F=0x0000 1111相与的结果

+|0 0 0 0 0 0 1 0|                                    n>>4与0x0F=0x0000 1111相与的结果

=|0 0 0 0 0 1 0 0|                                    相加

= 4                                                             最终结果,即为4

对于4byte的int型,代码如下:

int Method03_HammingWeight(int n)
{
	n = (n & 0x55555555) + ((n >> 1) & 0x55555555);
	n = (n & 0x33333333) + ((n >> 2) & 0x33333333);
	n = (n & 0x0F0F0F0F) + ((n >> 4) & 0x0F0F0F0F);
	n = (n & 0x00FF00FF) + ((n >> 8) & 0x00FF00FF);
	n = (n & 0x0000FFFF) + ((n >> 16) & 0x0000FFFF);
	return n;
}

上述代码就为Hamming Weight

代码

代码链接:

应用

  • 相似度检测
  • 3
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值