Java HashMap 核心源码解读

最新推荐文章于 2024-04-23 13:01:43 发布

dellheng

最新推荐文章于 2024-04-23 13:01:43 发布

阅读量5k

点赞数

分类专栏： Java基础文章标签： hashmap java table null equals 数据结构

Java基础专栏收录该内容

3 篇文章 0 订阅

订阅专栏

本文转载自 http://geeklu.com/2010/07/java-hashmap/

本篇对HashMap实现的源码进行简单的分析。
所使用的HashMap源码的版本信息如下：

/*
* @(#)HashMap.java 1.73 07/03/13
*
* Copyright 2006 Sun Microsystems, Inc. All rights reserved.
* SUN PROPRIETARY/CONFIDENTIAL. Use is subject to license terms.
*/

一.概述

在Java中每一个对象都有一个哈希码，这个值可以通过hashCode()方法获得。hashCode()的值和对象的equals方法息息相关，是两个对象的值是否相等的依据，所以当我们覆盖一个类的equals方法的时候也必须覆盖hashCode方法。

例如String的hashCode方法为：

 
  
      public  
      int hashCode 
      ( 
      )  
      { 
      
 
      int h  
      = hash 
      ; 
      
 
      if  
      (h  
      ==  
      0 
      )  
      { 
      
 
      int off  
      = offset 
      ; 
      
 
      char val 
      [ 
      ]  
      = value 
      ; 
      
 
      int len  
      = count 
      ; 
      
 
      
 
      for  
      ( 
      int i  
      =  
      0 
      ; i  
      &lt 
      ; len 
      ; i 
      ++ 
      )  
      { 
      
 h  
      =  
      31 
      *h  
      + val 
      [off 
      ++ 
      ] 
      ; 
      
 
      } 
      
 hash  
      = h 
      ; 
      
 
      } 
      
 
      return h 
      ; 
      
 
      } 
     
 

可以看得出，一个字符串的哈希值为s[0]*31^(n-1) + s[1]*31^(n-2) + … + s[n-1]，是一个整数。也就是说所有的字符串可以通过hashCode()将其映射到整数的区间中，由于在java中整数的个数是有限的（四个字节有正负，第一位为符号位-2^31~2^31-1），当s[0]*31^(n-1) + s[1]*31^(n-2) + … + s[n-1]足够大的时候可能会溢出，导致其变成负值。从上面的情况我们可以看出两个不同的字符串可能会被映射到同一个整数，发生冲突。因此java的开发人员选择了31这个乘数因子，尽量使得各个字符串映射的结果在整个java的整数域内均匀分布。

谈完java对象的哈希码，我们来看看今天的主角HashMap，HashMap可以看作是Java实现的哈希表。HashMap中存放的是key-value对，对应的类型为java.util.HashMap.Entry，所以在HashMap中数据都存放在一个Entry引用类型的数组table中。这里key是一个对象，为了把对象映射到table中的一个位置，我们可以通过求余法来，所以我们可以使用 [key的hashCode % table的长度]来计算位置（当然在实际操作的时候由于需要考虑table上的key的均匀分布可能需要对key的hashCode做一些处理）。

二.源码解析

put方法详解

 
 
            
      public V put 
      (K key, V value 
      )  
      { 
      
          
      if  
      (key  
      ==  
      null 
      ) 
      
              
      return putForNullKey 
      (value 
      ) 
      ; 
      
          
      int hash  
      = hash 
      (key. 
      hashCode 
      ( 
      ) 
      ) 
      ; 
      
          
      int i  
      = indexFor 
      (hash, table. 
      length 
      ) 
      ; 
      
          
      for  
      (Entry 
      <K,V 
      > e  
      = table 
      [i 
      ] 
      ; e  
      !=  
      null 
      ; e  
      = e. 
      next 
      )  
      { 
      
              
      Object k 
      ; 
      
              
      if  
      (e. 
      hash  
      == hash  
      &&  
      ( 
      (k  
      = e. 
      key 
      )  
      == key  
      || key. 
      equals 
      (k 
      ) 
      ) 
      )  
      { 
      
                 V oldValue  
      = e. 
      value 
      ; 
      
                 e. 
      value  
      = value 
      ; 
      
                 e. 
      recordAccess 
      ( 
      this 
      ) 
      ; 
      
                  
      return oldValue 
      ; 
      
              
      } 
      
          
      } 
      
 
      
         modCount 
      ++; 
      
         addEntry 
      (hash, key, value, i 
      ) 
      ; 
      
          
      return  
      null 
      ; 
      
      
      } 
     
 

在HashMap中我们的key可以为null，所以第一步就处理了key为null的情况。
当key为非null的时候，你也许会认为：恩，直接和table长度相除取模吧，但是这里没有，而是又好像做了一次哈希，这是为什么呢？这个还得先看indexFor(hash, table.length)方法，这个方法是决定存放位置的

 
 
            
      static  
      int indexFor 
      ( 
      int h,  
      int length 
      )  
      { 
      
          
      return h  
      &  
      (length 
      - 
      1 
      ) 
      ; 
      
      
      } 
     
 

明眼的都可以发现，因为在HashMap中table的长度为2^n（我们把运算都换成二进制进行考虑），所以h & (length-1)就等价于h%length，这也就是说，如果对原本的hashCode不做变换的话，其除去低length-1位后的部分不会对key在table中的位置产生任何影响，这样只要保持低length-1位不变，不管高位如何都会冲突，所以就想办法使得高位对其结果也产生影响，于是就对hashCode又做了一次哈希

 
           static int hash(int h) { 
      
         // This function ensures that hashCodes that differ only by 
      
         // constant multiples at each bit position have a bounded 
      
         // number of collisions (approximately 8 at default load factor). 
      
         h ^= (h >>> 20) ^ (h >>> 12); 
      
         return h ^ (h >>> 7) ^ (h >>> 4); 
      
     }

当找到key所对应的位置的时候，对对应位置的Entry的链表进行遍历，如果以及存在key的话，就更新对应的value，并返回老的value。如果是新的key的话，就将其增加进去。modCount是用来记录hashmap结构变化的次数的，这个在hashmap的fail-fast机制中需要使用（当某一个线程获取了map的游标之后，另一个线程对map做了结构修改的操作，那么原先准备遍历的线程会抛出异常）。addEntry的方法如下

 
 
            
      void addEntry 
      ( 
      int hash, K key, V value,  
      int bucketIndex 
      )  
      { 
      
     Entry 
      <K,V 
      > e  
      = table 
      [bucketIndex 
      ] 
      ; 
      
         table 
      [bucketIndex 
      ]  
      =  
      new Entry 
      <K,V 
      > 
      (hash, key, value, e 
      ) 
      ; 
      
          
      if  
      (size 
      ++  
      >= threshold 
      ) 
      
             resize 
      ( 
      2  
      * table. 
      length 
      ) 
      ; 
      
      
      } 
     
 

get方法

 
 
            
      public V get 
      ( 
      Object key 
      )  
      { 
      
          
      if  
      (key  
      ==  
      null 
      ) 
      
              
      return getForNullKey 
      ( 
      ) 
      ; 
      
          
      int hash  
      = hash 
      (key. 
      hashCode 
      ( 
      ) 
      ) 
      ; 
      
          
      for  
      (Entry 
      <K,V 
      > e  
      = table 
      [indexFor 
      (hash, table. 
      length 
      ) 
      ] 
      ; 
      
              e  
      !=  
      null 
      ; 
      
              e  
      = e. 
      next 
      )  
      { 
      
              
      Object k 
      ; 
      
              
      if  
      (e. 
      hash  
      == hash  
      &&  
      ( 
      (k  
      = e. 
      key 
      )  
      == key  
      || key. 
      equals 
      (k 
      ) 
      ) 
      ) 
      
                  
      return e. 
      value 
      ; 
      
          
      } 
      
          
      return  
      null 
      ; 
      
      
      } 
     
 

get方法其实就是将key以put时相同的方法算出在table的所在位置，然后对所在位置的链表进行遍历，找到hash值和key都相等的Entry并将value返回。

dellheng

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Java HashMap 核心源码解读

本文转载自 http://geeklu.com/2010/07/java-hashmap/本篇对HashMap实现的源码进行简单的分析。所使用的HashMap源码的版本信息如下：/** @(#)HashMap.java 1.73 07/03/13** Copyright 2006 Sun Microsystems, Inc. All rights reser
复制链接

扫一扫