HashMap源码分析

HashMap(JDK1.7

一、HashMap构造函数

  • 实例化HashMap对象
//通常我们会这样来实例化一个HashMap对象
Map hashMap = new HashMap();
//指定容量
Map hashMap = new HashMap(16);
//指定容量和加载因子
Map hashMap = new HashMap(16,0.75f);

而这三个构造函数背后是怎样的呢?我们依次来看源码。

在HashMap类中,有两个静态常量与HashMap对象的实例化息息相关,它们分别是默认初始容量DEFAULT_INITIAL_CAPACITY和默认加载因子DEFAULT_LOAD_FACTOR。

public class HashMap<K,V>
    extends AbstractMap<K,V>
    implements Map<K,V>, Cloneable, Serializable{
//默认初始化容量
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16
//最大容量
static final int MAXIMUM_CAPACITY = 1 << 30;
//默认加载因子
static final float DEFAULT_LOAD_FACTOR = 0.75f;
//保存键值对的数组
static final Entry<?,?>[] EMPTY_TABLE = {};
//保存键值对的数组,数组大小必须是2的幂次方2^n
transient Entry<K,V>[] table = (Entry<K,V>[]) EMPTY_TABLE;
//键值对的总数量值
transient int size;
//阈值,用于HashMap扩容的标志,threshold = capacity * loadFactor,
//即默认的话,threshold = 16 * 0.75 = 12,当HashMap中的键值对数量大于12(size>12)就会扩容
int threshold;
//加载因子
final float loadFactor;
//修改次数,记录HashMap结构改变的次数(扩容时HashMap中的元素(entry对象)下标可能改变,即结构发生变化)
transient int modCount;
//默认阈值
static final int ALTERNATIVE_HASHING_THRESHOLD_DEFAULT = Integer.MAX_VALUE;
transient int hashSeed = 0;
}
  • 无参构造(new HashMap())

    public HashMap() {
            this(DEFAULT_INITIAL_CAPACITY, DEFAULT_LOAD_FACTOR);
        }
    

    可见,当调用HashMap的无参构造器时会去调用HashMap带有两个参数的构造器,并把默认初始容量(16)和默认加载因子(0.75)传进去。

  • 一参构造(new HashMap(16))

    public HashMap(int initialCapacity) {
            this(initialCapacity, DEFAULT_LOAD_FACTOR);
        }
    

    当指定一个参数(即容量)来实例化HashMap对象时,也是调用了HashMap两个参数的构造器,并把我们指定的初始化容量和默认的加载因子传进去。

  • 两参构造(new HashMap(16,0.75f))

    public HashMap(int initialCapacity, float loadFactor) {
        	// 初始容量不能为负数  
        	if (initialCapacity < 0)
                throw new IllegalArgumentException("Illegal initial capacity: " +
                                                   initialCapacity);
        	// 如果初始容量大于最大容量,容量为最大容量  
        	if (initialCapacity > MAXIMUM_CAPACITY)
                initialCapacity = MAXIMUM_CAPACITY;
        	// 负载因子必须大于 0 的数值,否则抛出异常  
        	if (loadFactor <= 0 || Float.isNaN(loadFactor))
                throw new IllegalArgumentException("Illegal load factor: " +
                                                   loadFactor);
    
            this.loadFactor = loadFactor;
            threshold = initialCapacity;
            init();//空方法,即什么都没做
        }
    

    在两参构造函数中,我们可以指定初始化容量和加载因子,但这两个变量的值有一定的限制。

    为什么把初始容量赋值给阈值(threshold)?因为HashMap中没有定义一个用来标识初始化容量的变量哈哈,其实这样做是有好处的(至少省了一个变量的空间),请看下文。

HashMap构造总结

​ 无论是调用无参构造还是一参构造,再后还是会去调用两参构造,而无参构造使用默认初始容量(16)和默认加载因子(0.75)来实例化HashMap对象,一参构造用指定初始化容量和默认加载因子来实例化HashMap对象,两参构造可以指定初始化容量和加载因子来实例化HashMap对象,而初始化容量和加载因子有一定的范围限制。

二、HashMap使用

​ 首先先来了解下HashMap内部的数据结构,我把HashMap内部的部分定义提取出来

public class HashMap<K,V>
    extends AbstractMap<K,V>
    implements Map<K,V>, Cloneable, Serializable{
//保存键值对的数组
static final Entry<?,?>[] EMPTY_TABLE = {};
//保存键值对的数组,数组大小必须是2的幂次方2^n
transient Entry<K,V>[] table = (Entry<K,V>[]) EMPTY_TABLE;
//HashMap类内部有一个泛型静态内部类Entry<K,V>,用于存放键-值对
static class Entry<K,V> implements Map.Entry<K,V> {
        final K key;
        V value;
        Entry<K,V> next;	//指向下一个Entry对象,多个Entry对象构成一个单向链表
        int hash; 
        Entry(int h, K k, V v, Entry<K,V> n) {
            value = v;
            next = n;
            key = k;
            hash = h;
        }
       //省去setter、getter方法
        
    }
}

​ 由此,我们可以确定一个HashMap对象由一个数组构成,数组内存放的是Entry对象,而Entry对象中存放的才是我们put进去的键值对,而Entry对象中又有指向下一个Entry对象的引用,从而组成一个链表。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-dy4haNxv-1626608436343)(images/HashMap结构图.png)]

​ 而我们知道,对象是存储在堆中的,也就是说,对象内部(对象头和实例数据)没有存放另一个对象的空间,而只是存放了一个对象的引用。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-VuEFEdxu-1626608436345)(images/堆空间对象分布.png)]

​ 实例化HashMap对象后,我们就可以对其使用了,接下来对HashMap中方法的执行过程进行解析。

​ 在实例化HashMap后,HashMap中还没有什么元素可以让我们使用,所有我们先往里面放东西吧。

put方法

//实例化HashMap
Map hashMap = new HashMap();
//往HashMap中放东西,为键-值对
hashMap.put("name","张三");

public V put(K key, V value) {
  //判断这个表是否为空,为空则进行初始化,
  if (table == EMPTY_TABLE) {
    inflateTable(threshold);
  }
  // 如果 key 为 null,调用 putForNullKey 方法进行处理  
  if (key == null)
    return putForNullKey(value);
  // 计算key的hash值
  int hash = hash(key);
  // 根据key的hash值和表长计算该Entry对象应存放的table下标 
  int i = indexFor(hash, table.length);
  // 计算到下标后,如果当前下标已有Entry对象,则遍历该Entry链表
  for (Entry<K,V> e = table[i]; e != null; e = e.next) {
    Object k;
    //两个对象的hash值相等不代表两个对象相等,只能说这两个对象存储在同一内存空间中
    //判断两个对象是否存储在同一内存空间,虽然两者在table中的下标一样,但在堆中空间地址可能不同
    //如果不同的话,就不需要判断后面的了,提高了效率,大概是这样吧
    //姑且认为这里是判断要插入的Entry对象的key是否已经存在吧
    //如果key存在则覆盖该key对应的value,并返回旧vlaue
    if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
      V oldValue = e.value;
      e.value = value;
      // 将该元素的访问存入历史记录中(在LinkedHashMap才发挥作用)
      e.recordAccess(this);
      return oldValue;
    }
  }

  //上面的循环结束表示当前的key不存在与表中,需要另外增加Entry对象(头插法)
  // 标志容器被修改次数的计数器,在使用迭代器遍历时起作用
  modCount++;
  // 将 key、value 添加到 i 索引处  	// 为新值创建一个新元素,并添加到数组中
  addEntry(hash, key, value, i);
  return null;
}

​ 在向HashMap中put对象时,需要判断HashMap对象存放Entry<K,V> 的数组初始化了没,如果没有则需要先初始化。

​ 注意,之前调用HashMap的构造函数实例化HashMap对象时,并没有对该数组初始化,只是声明了该数组要初始化的大小而已。

inflateTable(threshold)

 if (table == EMPTY_TABLE) {
    inflateTable(threshold);
  }

private void inflateTable(int toSize) {
        // 将数组容量大小初始化为2^n
        int capacity = roundUpToPowerOf2(toSize);

        //重新设置阀值 
        threshold = (int) Math.min(capacity * loadFactor, MAXIMUM_CAPACITY + 1);
        //这里初始化table数组的大小 
        table = new Entry[capacity];
        //根据capacity初始化hashSeed
        initHashSeedAsNeeded(capacity);
    }

private static int roundUpToPowerOf2(int number) {
     //如果初始化容量大于MAXIMUM_CAPACITY则容量为MAXIMUM_CAPACITY
  	//容量小于1则为1,容量在(1,MAXIMUM_CAPACITY)之间就取大于等于该初始化容量的最小的2^n值
    return number >= MAXIMUM_CAPACITY
      ? MAXIMUM_CAPACITY
      : (number > 1) ? Integer.highestOneBit((number - 1) << 1) : 1;
}

public static int highestOneBit(int i) {
        // HD, Figure 3-1
        i |= (i >>  1);
        i |= (i >>  2);
        i |= (i >>  4);
        i |= (i >>  8);
        i |= (i >> 16);
        return i - (i >>> 1);
    }
/*
	假设我们使用new HashMap(17);来实例化HashMap对象,则HashMap会创建一个容量为32的数组,而不是17
	为什么呢?下面为table初始化的4个过程:
      1.threshold = initialCapacity;
      2.inflateTable(threshold);
      3.int capacity = roundUpToPowerOf2(toSize)——>Integer.highestOneBit((number - 1) << 1)
      4.table = new Entry[capacity];
    当传入17后,capacity的值为Integer.highestOneBit((17 - 1) << 1
    我们知道,在Java中,int为32bit	|= 按位或运算,有1则为1
    首先 将 17-1 = 16 转为二进制位	0000 0000 0000 0000 0000 0000 0001 0000
    每次右移后再与自己按位或运算,由此可知,最后i为:0000 0000 0000 0000 0000 0000 0001 1111	
    >>> 无符号右移 无论正负,右移后高位都是补0
    i - (i >>> 1);	 0000 0000 0000 0000 0000 0000 0001 1111
    				0000 0000 0000 0000 0000 0000 0000 1111
    			=   0000 0000 0000 0000 0000 0000 0001 0000 = 32
    
	OK,最后把32返回,并初始化
*/
if (key == null)
    return putForNullKey(value);

//这里和没啥好说的,只需要记住HashMap可以存储key为null的键就行了
private V putForNullKey(V value) {
        for (Entry<K,V> e = table[0]; e != null; e = e.next) {
            if (e.key == null) {
                V oldValue = e.value;
                e.value = value;
                e.recordAccess(this);
                return oldValue;
            }
        }
        modCount++;
        addEntry(0, null, value, 0);
        return null;
    }

addEntry(hash, key, value, i);

void addEntry(int hash, K key, V value, int bucketIndex) {
    // 如果 Map 中的 key-value 对的数量超过阈值并且要添加Entry对象的数组下标已有Entry对象,则进行扩容
    if ((size >= threshold) && (null != table[bucketIndex])) {
      // 把 table 对象的长度扩充到 2 倍。  
      resize(2 * table.length);
      hash = (null != key) ? hash(key) : 0;
      //寻找指定hash值对应的存放位置 
      bucketIndex = indexFor(hash, table.length);
    }

    // 创建新元素并添加到数组中
    createEntry(hash, key, value, bucketIndex);
}
void resize(int newCapacity) {
    Entry[] oldTable = table;
    int oldCapacity = oldTable.length;
  	//如果数组大小已是最大值,则没法扩容,直接返回
    if (oldCapacity == MAXIMUM_CAPACITY) {
      threshold = Integer.MAX_VALUE;
      return;
    }
	//创建容量为原来2倍的新数组
    Entry[] newTable = new Entry[newCapacity];	 
    //重新hash 
    transfer(newTable, initHashSeedAsNeeded(newCapacity));
    table = newTable;
    threshold = (int)Math.min(newCapacity * loadFactor, MAXIMUM_CAPACITY + 1);
  }


void transfer(Entry[] newTable, boolean rehash) {	// rehash 是否重新hash 
        int newCapacity = newTable.length;
        for (Entry<K,V> e : table) {		//依次从旧数组元素下标0开始循环这个旧表
            while(null != e) {		//循环处理对应数据元素,重新hash,并放入到新表
                Entry<K,V> next = e.next;		//先取出下一个元素
                if (rehash) {
                    e.hash = null == e.key ? 0 : hash(e.key);
                }
                int i = indexFor(e.hash, newCapacity);
                e.next = newTable[i];	//让先进来的往链表下移,新近的放在链表头	
                newTable[i] = e;	//将e元素保存到新表的newTable[i]位置中
                e = next;		 //e元素链表下移一位
            }
        }
    }
void createEntry(int hash, K key, V value, int bucketIndex) {
    // 获取指定 bucketIndex 索引处的 Entry   
    Entry<K,V> e = table[bucketIndex];
    // 将新创建的 Entry 放入 bucketIndex 索引处,并让新的 Entry 指向原来的 Entry   
    // 头插法建立链 
    table[bucketIndex] = new Entry<K,V>(hash, key, value, e);
    size++;
  }

总结

​ 当我们往HashMap中put键值对时,其实是在HashMap类中的静态内部类Entry<K,V> 保存我们的键值数据,而Entry对象保存在一个Entry数组对象table中,而每一个Entry对象内又有一个Entry<K,V> 对象。这样,每一个table下标就保存了一个Entry对象链表。

​ 而Entry对象要存储时会根据自己的hash值和table表长来计算要存在哪个数组下标下,并判断该下标是否已有元素,如果没有则直接插入,有则需要遍历Entry对象链表,判断是否已存在key值,没有则直接插入,有则覆盖,并返回旧value

​ 如果存入的键值对数量超过了阈值则进行扩容,能够扩容则扩容为旧数组长度的两倍。

​ 扩容时遍历数组以及Entry链表,并对Entry对象重写哈希运算,计算出新的数组下标值

​ 最后完成插入

get方法

public V get(Object key) {
    // 如果 key 是 null,调用 getForNullKey 取出对应的 value  	//如果key为null,则按照null规则处理  
    if (key == null)
      return getForNullKey();
    //key!=null;调用getEntry方法
    Entry<K,V> entry = getEntry(key);

    return null == entry ? null : entry.getValue();
}

 private V getForNullKey() {
     if (size == 0) {
       return null;
     }
     for (Entry<K,V> e = table[0]; e != null; e = e.next) {
       if (e.key == null)
         return e.value;
     }
     return null;
 }

final Entry<K,V> getEntry(Object key) {
    if (size == 0) {
      return null;
    }

    //通过key的hash值确定table下标(null对应下标0)
    // 根据该 key 值计算它的 hash 码  
    int hash = (key == null) ? 0 : hash(key);
    // 直接取出 table 数组中指定索引处的值,
    for (Entry<K,V> e = table[indexFor(hash, table.length)];
         e != null;
         // 搜索该 Entry 链的下一个 Entry
         e = e.next) {
      Object k;
      // 如果该 Entry 的 key 与被搜索 key 相同  
      if (e.hash == hash &&
          ((k = e.key) == key || (key != null && key.equals(k))))		//所以不仅要判断hash还要判断key(因为不同的key可能有相同的hash值) 
        return e;
    }
    return null;
}

总结

​ get方法比较简单,如果HashMap中没有元素,则返回null,key为空则返回key为null的value

​ 如果key不为null则计算key的哈希值获取数组table下标,再遍历Entry链表,找到key相同的Entry对象并返回value

remove方法

public V remove(Object key) {
    Entry<K,V> e = removeEntryForKey(key);
    return (e == null ? null : e.value);
}

final Entry<K,V> removeEntryForKey(Object key) {
    if (size == 0) {
      return null;
    }
    int hash = (key == null) ? 0 : hash(key);
    int i = indexFor(hash, table.length);
    Entry<K,V> prev = table[i];
    Entry<K,V> e = prev;

    while (e != null) {
      Entry<K,V> next = e.next;
      Object k;
      if (e.hash == hash &&
          ((k = e.key) == key || (key != null && key.equals(k)))) {
        modCount++;
        size--;
        if (prev == e)
          table[i] = next;
        else
          prev.next = next;
        e.recordRemoval(this);
        return e;
      }
      prev = e;
      e = next;
    }

    return e;
}

总结

​ remove(key)根据key来计算数组下标——>遍历Entry链表,修改指针。

clear方法

public void clear() {
    modCount++;
    Arrays.fill(table, null);
    size = 0;
}
public static void fill(Object[] a, Object val) {
        for (int i = 0, len = a.length; i < len; i++)
            a[i] = val;
    }

总结

​ clear方法将table中的所有值都置为空,并把size变为0。

接下来介绍jdk1.8中的HashMap,并与jdk1.7做对比

HashMap(jdk1.8)

public class HashMap<K,V> extends AbstractMap<K,V>
    implements Map<K,V>, Cloneable, Serializable {
    static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16
    static final int MAXIMUM_CAPACITY = 1 << 30;
    static final float DEFAULT_LOAD_FACTOR = 0.75f;
    //当Node对象数目为8时转换为红黑树
    static final int TREEIFY_THRESHOLD = 8;
    //当Node对象数目为6时转换为链表
    static final int UNTREEIFY_THRESHOLD = 6;
    static final int MIN_TREEIFY_CAPACITY = 64;
    //保存键-值对对象的数组
    transient Node<K,V>[] table;
    transient int size;
    transient int modCount;
    int threshold;
    final float loadFactor;
    //HashMap的内部类,Node类用于保存键-值对
    static class Node<K,V> implements Map.Entry<K,V> {
        final int hash;
        final K key;
        V value;
        Node<K,V> next;

        Node(int hash, K key, V value, Node<K,V> next) {
            this.hash = hash;
            this.key = key;
            this.value = value;
            this.next = next;
        }
}

总结

​ jdk1.8中的HashMap中没有Entry内部类,取而代之的是Node内部类,但这两者其实功能是一样的

​ 并且多了TREEIFY_THRESHOLD = 8、UNTREEIFY_THRESHOLD = 6、MIN_TREEIFY_CAPACITY = 64属性,这几个属性用于Node对象存储结构的转变(链表和红黑树)

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-QpzR9x1y-1626608436346)(images/jdk1.8结构.png)]

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-fuHYimBa-1626608436348)(images/jdk1.7结构.png)]

HashMap构造函数

   public HashMap(int initialCapacity, float loadFactor) {
     if (initialCapacity < 0)
       throw new IllegalArgumentException("Illegal initial capacity: " +
                                          initialCapacity);
     if (initialCapacity > MAXIMUM_CAPACITY)
       initialCapacity = MAXIMUM_CAPACITY;
     if (loadFactor <= 0 || Float.isNaN(loadFactor))
       throw new IllegalArgumentException("Illegal load factor: " +
                                          loadFactor);
     this.loadFactor = loadFactor;
	//构造HashMap时就将容量转换为2的幂次方,相比于jdk1.7提前了
     //jdk1.7是在第一次put时判空后才将容量转换为2的幂次方倍
     this.threshold = tableSizeFor(initialCapacity);
   }

总结

​ 在jdk1.8中,使用HashMap构造函数进行实例化HashMap对象时,就将容量转换为2的幂次方倍数,并且直接在tableSizeFor()方法中进行转换;而在jdk1.8中,容量转为2的幂次方倍是在进行第一次put时进行的,并且需要调用Integer类中的方法进行转换(inflateTable—>roundUpToPowerOf2—>Integer.highestOneBit)

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-DQlOTMSU-1626608436349)(images/jdk1.8.png)]

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-osjnzhSr-1626608436351)(images/jdk1.7.png)]

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-WgrsTREW-1626608436352)(images/Integer.png)]

put()方法

public V put(K key, V value) {
  return putVal(hash(key), key, value, false, true);
}

//参数onlyIfAbsent用于判断是否更新,为true时表示如果插入的key已经存在,可不更新value值,默认为false
//参数evict用于判断是否使用已有表,默认为ture,为false时表示新建表插入
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
    Node<K,V>[] tab; Node<K,V> p; int n, i;
    if ((tab = table) == null || (n = tab.length) == 0)
      n = (tab = resize()).length;
    if ((p = tab[i = (n - 1) & hash]) == null)
      tab[i] = newNode(hash, key, value, null);
    else {
      Node<K,V> e; K k;
      if (p.hash == hash &&
          ((k = p.key) == key || (key != null && key.equals(k))))
        e = p;
      else if (p instanceof TreeNode)
        e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
      else {
        for (int binCount = 0; ; ++binCount) {
          if ((e = p.next) == null) {
            p.next = newNode(hash, key, value, null);
            if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
              treeifyBin(tab, hash);
            break;
          }
          if (e.hash == hash &&
              ((k = e.key) == key || (key != null && key.equals(k))))
            break;
          p = e;
        }
      }
      if (e != null) { // existing mapping for key
        V oldValue = e.value;
        if (!onlyIfAbsent || oldValue == null)
          e.value = value;
        afterNodeAccess(e);
        return oldValue;
      }
    }
    ++modCount;
    if (++size > threshold)
      resize();
    afterNodeInsertion(evict);
    return null;
}
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值