[转]计算一个无符整数中1Bit的个数(2)

最新推荐文章于 2022-11-26 19:14:46 发布

jemmy

最新推荐文章于 2022-11-26 19:14:46 发布

阅读量1.1k

点赞数

分类专栏： C/C++ 文章标签：优化算法 numbers 存储 c

本文链接：https://blog.csdn.net/jemmy/article/details/4390285

版权

C/C++ 专栏收录该内容

36 篇文章 0 订阅

订阅专栏

7合并计数器法的优化

优化1：

算法的优化:基于以下两点合并计数器法可以进行优化：

1) 和的存储空间为 log₂ (the number of bits being counted)*（coutern number）.随着（coutern number）减少，需要的存储bit减少。但是实际每次都被存储在一个32位整数。

2) 在多数架构中，简单的8-bit的常量比32-bit的更容易构造。

基于以上2点，最后的一步：

i = (i&MASK16) + (i>>16&MASK16)

可以变成：

i = (i + (i>>16))&MASK6;

MASK6是(1<<6)-1 or 0x1F,可以消除需要进行MASK16的操作。

经过这样的优化，可以节省两个操作：建立各大整数常量和一个与（AND）操作

unsigned numbits(unsigned int v)

       unsigned int const MASK1  = 0x55555555;

       unsigned int const MASK2  = 0x33333333;

       unsigned int const MASK4  = 0x0f0f0f0f;

       unsigned int const MASK6 = 0x0000003f;

       unsigned int const w = (v & MASK1) + ((v >> 1) & MASK1);

       unsigned int const x = (w & MASK2) + ((w >> 2) & MASK2);

       unsigned int const y = (x + (x >> 4) & MASK4);

       unsigned int const z = (y + (y >> 8));

       unsigned int const c = (z + (z >> 16)) & MASK6;

       return c;

举个例子，假设输入的i值为10010111011111010101101110101111（十进制2541575087）

计算过程如下：（共22个1）

1. 将32个计数器合并为16个,每一个计数器代表 2-bit 的1个数

1 0 0 1 0 1 1 0 0 0 1 1 1 1 1 1 = 1 0 0 1 0 1 1 0 0 0 1 1 1 1 1 1

+0 1 1 1 1 1 1 1 1 1 0 1 0 0 1 1 = 0 1 1 1 1 1 1 1 1 1 0 1 0 0 1 1

----------------------------------------------------------------------

1 1 1 2 1 2 2 1 1 1 1 2 1 1 2 2 = 01 01 01 10 01 10 10 01 01 01 01 10 01 01 10 10

2. 将16个计数器合并为8个,每一个计数器代表 4-bit 的1个数

1 1 1 2 1 1 1 2 = 01 01 01 10 01 01 01 10

+1 2 2 1 1 2 1 2 = 01 10 10 01 01 10 01 10

--------------- ---------------------------------------

2 3 3 3 2 3 2 4 = 0010 0011 0011 0011 0010 0011 0010 0100

3. 将8个计数器合并为4个,每一个计数器代表 8-bit 的1个数：y = (x + (x >> 4) & MASK4)

0010 0011 0011 0011 0010 0011 0010 0100

+ 0000 0010 0011 0011 0011 0010 0011 0010

------- ---------------------------------------------------

0010 0101 0110 0110 0101 0101 0101 0110

&MASK4 0000 1111 0000 1111 0000 1111 0000 1111

------- --------------------------------------------------

0000 0101 0000 0110 0000 0101 0000 0110

4. 计算相邻的每对（只有2对,即4个Counter）8bit计数器的和（不进行合并计数器的操作）。

0000 0101 0000 0110 0000 0101 0000 0110

+ 0000 0000 0000 0101 0000 0110 0000 0101

----- ---------------------------------

0000 0101 0000 1011 0000 1011 0000 1011

5. 计算最后一对Counter(16BitCounter)的和，并根据掩码求出世纪的有效数字。其实将4，5步的与掩码运算合并为只进行一次。

0000 0101 0000 1011 0000 1011 0000 1011

0000 0000 0000 0000 0000 0101 0000 1011

-- --------------------------------

0000 0101 0000 1011 0001 0000 0001 0110

&MASK6 0000 0000 0000 0000 0000 0000 0011 1111

-- --------------------------------

0000 0000 0000 0000 0000 0000 0001 0110 = 22

优化2：

然而以上的算法，仍然可以优化为：这也许是最好的算法了。

unsigned numbits(unsigned int v)

       unsigned int const MASK1 = 0x55555555;

       unsigned int const MASK2 = 0x33333333;

       unsigned int const MASK4 = 0x0f0f0f0f;

       unsigned int const w = v - ((v >> 1) & MASK1);

       unsigned int const x = (w & MASK2) + ((w >> 2) & MASK2);

       unsigned int const y = (x + (x >> 4) & MASK4);

       unsigned int const c = (y * 0x01010101) >> 24;

       return c;

与优化1比较，又进行了以下两点优化：

1) 为了在第一行不使用AND操作，替换相邻位相加的操作为：v减去它的右移操作后与掩码操作的结果。这个结果以相同的。00 - 0 = 0, 01 - 0 = 01, 10 - 1 = 01, 11 - 1 = 10

即：

v= (v&MASK1 ) + (v>>1 &MASK1 );

w = v - ((v >> 1) & MASK1);

v=w

2) 为了合并最后两行，使用了一个乘法运算（00000001 00000001 00000001 00000001）和一个位移操作（只取最右边6位），这样的处理在一步就累加了4Bit大小的计数器。可以回忆乘法运算的竖式计算法，就是对第三步的结果Y,分为每8bit大小的四组，然后求和。

优化3：

还可以进行如下的优化：

#define MASK_01010101 (((unsigned int)(-1))/3)

#define MASK_00110011 (((unsigned int)(-1))/5)

 #define MASK_00001111 (((unsigned int)(-1))/17)

 int bitcount (unsigned int n)

       n = (n & MASK_01010101) + ((n >> 1) & MASK_01010101) ;

    n = (n & MASK_00110011) + ((n >> 2) & MASK_00110011) ;

    n = (n & MASK_00001111) + ((n >> 4) & MASK_00001111) ;

    return n % 255 ;

请根据除法的意义思考为什么取255的余数。

8 MIT_HACKEMEM计数法MIT HACKMEM Count

int bitcount(unsigned int n)

       /* works for 32-bit numbers only       */

       /* fix last line for 64-bit numbers */

register unsigned int tmp;

       tmp = n - ((n >> 1) & 033333333333)

               - ((n >> 2) & 011111111111);

      return ((tmp + (tmp >> 3)) & 030707070707) % 63;

这是一种很巧妙的算法：

考虑一个3Bit数N，可以看成4a+2b+c（a,b,c为0 或者1），如果右移一位，得到2a+b,然后从原始的数（4a+2b+c）里减去2a+b，(N-N>>1)差为2a+b+c。如果右移两位，得到a,然后用刚才得到的差2a+b+c减去a，(即(N-N>>1-N>>2)结果是a+b+c，这就是原始的数字里Bit为1的个数。

这个算法如何实现呢？首先声明一个临时变量tmp。认为tmp是8进制描述的。8进制的每个数字都是n中相应的每3Bit位所描述的数字。最后返回这些8进制数的和就是我们需要的最终答案了。关键是，将相邻的8进制对加在一起，然后计算时记得对63(2的(3+3）次幂）-1)进行除运算取得余数。实现方法是：使用tmp右移3位、然后与自身相加，再与一个适当的掩码进行AND操作，产生一个数，这个数是相邻6位中含有Bit1的个数。

对64位数来说，应该比8进制数的多3倍（4倍），所以要对1023（64*（2的4次幂）-1）求模。(这算法在X11代码中被用到过。)

jemmy

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
[转]计算一个无符整数中1Bit的个数(2)

7合并计数器法的优化优化1：算法的优化:基于以下两点合并计数器法可以进行优化：1) 和的存储空间为 log2 (the number of bits being counted)*（coutern number）.随着（coutern number）减少，需要的存储bit减少。但是实际每次都被存储在一个32位整数。2) 在多数
复制链接

扫一扫