知道为啥HashMap里面的数组size必须是2的次幂？

最新推荐文章于 2021-02-12 19:43:56 发布

mojolang

最新推荐文章于 2021-02-12 19:43:56 发布

阅读量1.3k

点赞数

分类专栏： java 文章标签： java

java 专栏收录该内容

203 篇文章 1 订阅

订阅专栏

最近在写一个简易的分离锁的类:

要求：对不同的Key进行hash得到一个Lock，并要求对锁映射的概率差不多。比如，160个Key，分布到16个锁上，大概有10个Key是映射到同一个锁上的，只要这样并发效率才会高。

    Java代码   
    
  
 public class SplitReentrantLock {  
   
     private Lock[] locks;  
   
     private int LOCK_NUM;  
   
     public SplitReentrantLock(int lockNum) {  
         super();  
         LOCK_NUM = lockNum;  
         locks = new Lock[LOCK_NUM];  
         for (int i = 0; i < LOCK_NUM; i++) {  
             locks[i] = new ReentrantLock();  
         }  
     }  
   
     /** 
      * 获取锁, 使用HashMap的hash算法 
      *  
      *  
      * @param key 
      * @return 
      */  
     public Lock getLock(String key) {  
   
         int lockIndex = index(key);  
         return locks[lockIndex];  
     }  
   
     int index(String key) {  
         int hash = hash(key.hashCode());          
         return hash & (LOCK_NUM - 1);  
     }  
   
     int hash(int h) {  
         h ^= (h >>> 20) ^ (h >>> 12);  
         return h ^ (h >>> 7) ^ (h >>> 4);  
     }  

用法：

    Java代码   
    
  
 SplitReentrantLock locks = new SplitReentrantLock(16);  
   Lock lock =locks.getLock(key);   
   lock.lock();  
   try{  
      //......  
    }finally{  
    lock.unlock();   
    }  

本来认为用HashMap的hash算法就能够将达到上述的要求，结果测试的时候吓了一跳。

测试代码：

    Java代码   
    
  
 public class SplitReenterLockTest extends TestCase {  
   
     public void method(int lockNum, int testNum) {  
   
         SplitReentrantLock splitLock = new SplitReentrantLock(lockNum);  
         Map<Integer, Integer> map = new TreeMap<Integer, Integer>();  
         for (int i = 0; i < lockNum; i++) {  
             map.put(i, 0);  
         }  
         for (int i = 0; i < testNum; i++) {  
             Integer key = splitLock.index(RandomStringUtils.random(128));  
             map.put(key, map.get(key) + 1);  
         }  
   
         for (Map.Entry<Integer, Integer> entry : map.entrySet()) {  
             System.out.println(entry.getKey() + " : " + entry.getValue());  
         }  
     }  
   
     public void test1() {  
         method(50, 1000);}  
    
 }  

结果：1000个随机key的hash只是映射到8个 Lock上，而不是平均到50个Lock上。

而且是固定分布到0,1,16,17,32,33,48,49的数组下标对应的Lock上面，这是为什么呢？

如果改为：

    Java代码   
    
  
 public void test1() {  
     method(32, 1000);  
 }  

结果：1000个随机key的hash 映射到32个Lock上，而且基本上是平均分布的。

问题：为什么50和32的hash的效果差别那么大呢？

再次测试2,4,8,16,64,128. 发现基本上都是平均分布到所有的Lock上面。

得到平均分布的这些数都是2的次幂，难道hash算法和二进制有关？

看看hash算法：

    Java代码   
    
  
   int index(String key) {  
     int hash = hash(key.hashCode());          
     return hash & (LOCK_NUM - 1);  
 }  
   
 int hash(int h) {  
     h ^= (h >>> 20) ^ (h >>> 12);  
     return h ^ (h >>> 7) ^ (h >>> 4);  
 }  

先是经过神奇的(ps：不知道为什么这么运算，无知的我只能用神奇来形容)的位运算，最后和LOCK_NUM - 1来进行与运算。

本帖的关键点就是在于这个与运算中，如果要想运算后的结果是否平均分布，在于LOCK_NUM-1的二进制中1的位数有几个。如果都是1,那么肯定是平均分布到0至LOCK_NUM-1上面。否则仅仅分布指定的几位。

下面以50和32说明：

假设Key进行hash运行得到hash值为h,

比如：我测试的数据中的一些h的二进制值：

    Java代码   
    
  
 1100000010000110110101010001001  
 10111100001001110111000100010001  
 11111011111010101010000111001001  
 11001010011000100110110111011111  
 10001010100010111101011010011110