JDK源码之-HashMap

JAVA集合框架主要有两组接口,一个是java.util.Collection,另一个是java.util.Map。Map是我们经常使用的一个集合接口,它是一种<K,V>键值对型的结构。常用的实现有HashMap,TreeMap。本文基于JDK1.7来分析一下HashMap 的实现。

Map接口的主要方法

int size();

boolean containsKey(Object key);

V get(Object key);

V put(K key, V value);

V remove(Object key);

Set<K> keySet();

Set<Map.Entry<K, V>> entrySet();

HashMap的具体实现

HashMap有几个构造函数,HashMap(), HashMap(int initialCapacity), HashMap(int initialCapacity, float loadFactor),HashMap(Map<? extends K, ? extends V> m)。不同的构造函数决定了HashMap的初始容量和装填因子。HashMap是一种数组+链表的结构,它声明了一个Entry<K,V>[] table数组,Entry<K,V>本身是一个链表结构。如不自定义,HashMap默认的初始容量为16,初始装填因子为0.75。我们接下来分别从HashMap常用的操作来看看它是如何实现的。
V put(K key, V value) //向HashMap中添加一个元素
    public V put(K key, V value) {
        if (key == null)
            return putForNullKey(value);
        int hash = hash(key);
        int i = indexFor(hash, table.length);
        for (Entry<K,V> e = table[i]; e != null; e = e.next) {
            Object k;
            if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
                V oldValue = e.value;
                e.value = value;
                e.recordAccess(this);
                return oldValue;
            }
        }

        modCount++;
        addEntry(hash, key, value, i);
        return null;
    }

1.HashMap允许key为null,找到table[0]处的Entry<K,V>,也就是说key为null的Entry永远只会被放在数组的第一位的链表上。获取到table[0]处的Entry并对它进行遍历,如果找到已经存在了key为null的Entry,则用新的value替换掉旧的Entry的value。如果没有找到则在表头添加一个新的Entry,注意,在任何添加新元素的时候都需要注意HashMap的size()是否到达了阈值,该阈值=HashMap容量*装填因子。例如不自定义HashMap容量和装填因子时,该阈值为16*0.75=12即当HashMap中有12个Entry的时候,HashMap会自动进行一次扩容,具体的扩容机制我们后面会提到。

    private V putForNullKey(V value) {
        for (Entry<K,V> e = table[0]; e != null; e = e.next) {
            if (e.key == null) {
                V oldValue = e.value;
                e.value = value;
                e.recordAccess(this);
                return oldValue;
            }
        }
        modCount++;
        addEntry(0, null, value, 0);
        return null;
    }

2.根据key的hash值找到数组中映射的位置,JDK中的做法是h & (length-1),key的hash值和数组table的长度减一作与操作。HashMap中table数组的长度永远是2的幂次方,即使你想创造一个奇数个数的HashMap。之所以这样做是的原因是capacity为偶数,(capacity-1)为奇数,在与key的hash值做&操作时,会大大减少冲突的产生。

while (capacity < initialCapacity)
   capacity <<= 1;

3.在数组映射的位置上替换或添加新的Entry。同样遍历Entry,试图找寻链表中已有的Entry,如果找到了key相同或者满足key.equals(k)方法的Entry,则用新的Value替换掉旧的Entry的Value;如果没找到则以在表头添加Entry的形式加入到已有的链表中。

for (Entry<K,V> e = table[i]; e != null; e = e.next) {
    Object k;
    if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
       V oldValue = e.value;
       e.value = value;
       e.recordAccess(this);
       return oldValue;
    }
}

V get(Object key);//获取HashMap中指定Key的值
    public V get(Object key) {
        if (key == null)
            return getForNullKey();
        Entry<K,V> entry = getEntry(key);

        return null == entry ? null : entry.getValue();
    }

1.如果key为null,拿到table[0]位置的Entry,对其进行遍历,若找到key为null的Entry,则返回;若未找到,则直接返回null。
2.同样的,对于key不为null的情况,先计算其hash值,然后再找到该key在table中的位置,获取到该位置处的Entry进行遍历。

    final Entry<K,V> getEntry(Object key) {
        int hash = (key == null) ? 0 : hash(key);
        for (Entry<K,V> e = table[indexFor(hash, table.length)];
             e != null;
             e = e.next) {
            Object k;
            if (e.hash == hash &&
                ((k = e.key) == key || (key != null && key.equals(k))))
                return e;
        }
        return null;
    }

V remove(Object key);//移除HashMap中指定Key的值
    public V remove(Object key) {
        Entry<K,V> e = removeEntryForKey(key);
        return (e == null ? null : e.value);
    }

如果key为null,则获取table[0]位置的Entry,否则计算该key的hash值找到该key在table中的位置处的Entry。对其进行遍历,直至找到key相同或者满足key.equals(k)条件的Entry,对其进行一次单链表节点的删除操作。

接下来我们来分析一下HashMap的自动扩容机制,当HashMap中Entry数目达到了阈值时,就需要对它进行扩容,容量为两倍于当前table的长度,并将现有table中所有的Entry进行rehash添加到新的newTable中去。

    void resize(int newCapacity) {
        Entry[] oldTable = table;
        int oldCapacity = oldTable.length;
        if (oldCapacity == MAXIMUM_CAPACITY) {
            threshold = Integer.MAX_VALUE;
            return;
        }

        Entry[] newTable = new Entry[newCapacity];
        boolean oldAltHashing = useAltHashing;
        useAltHashing |= sun.misc.VM.isBooted() &&
                (newCapacity >= Holder.ALTERNATIVE_HASHING_THRESHOLD);
        boolean rehash = oldAltHashing ^ useAltHashing;
        transfer(newTable, rehash);
        table = newTable;
        threshold = (int)Math.min(newCapacity * loadFactor, MAXIMUM_CAPACITY + 1);
    }

    void transfer(Entry[] newTable, boolean rehash) {
        int newCapacity = newTable.length;
        for (Entry<K,V> e : table) {
            while(null != e) {
                Entry<K,V> next = e.next;
                if (rehash) {
                    e.hash = null == e.key ? 0 : hash(e.key);
                }
                int i = indexFor(e.hash, newCapacity);
                e.next = newTable[i];
                newTable[i] = e;
                e = next;
            }
        }
    }

依然是通过key的hash值与(newTable.length-1)做与操作取模确定好新的位置,以下代码相当于在表头添加Entry。
e.next = newTable[i];

newTable[i] = e;

我们分析完了HashMap基本常用的操作和扩容在JDK1.7中的实现,在后续的JDK源码解读中还会给大家带来JDK1.8版本与1.7版本的异同。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
HashMap 是一种哈希表数据结构,它实现了 Map 接口,可以存储键值对。下面是 JDK 8 中 HashMap 的码详解。 1. 基本概念 哈希表是一种基于散列原理的数据结构,它通过将关键字映射到表中一个位置来访问记录,以加快查找的速度。在哈希表中,关键字被映射到一个特定的位置,这个位置就称为哈希地址或散列地址。哈希表的基本操作包括插入、删除和查找。 2. 类结构 HashMap 类结构如下: ``` public class HashMap<K,V> extends AbstractMap<K,V> implements Map<K,V>, Cloneable, Serializable { ... } ``` HashMap 继承了 AbstractMap 类,并实现了 Map 接口,同时还实现了 Cloneable 和 Serializable 接口,表示该类可以被克隆和序列化。 3. 数据结构 JDK 8 中的 HashMap 采用数组 + 链表(或红黑树)的结构来实现哈希表。具体来说,它使用了一个 Entry 数组来存储键值对,每个 Entry 对象包含一个 key 和一个 value,以及一个指向下一个 Entry 对象的指针。当多个 Entry 对象的哈希地址相同时,它们会被放入同一个链表中,这样就可以通过链表来解决哈希冲突的问题。在 JDK 8 中,当链表长度超过阈值(默认为 8)时,链表会被转化为红黑树,以提高查找的效率。 4. 哈希函数 HashMap 的哈希函数是通过对 key 的 hashCode() 方法返回值进行计算得到的。具体来说,它使用了一个称为扰动函数的算法来增加哈希值的随机性,以充分利用数组的空间。在 JDK 8 中,HashMap 使用了以下扰动函数: ``` static final int hash(Object key) { int h; return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16); } ``` 其中,^ 表示按位异或,>>> 表示无符号右移。这个函数的作用是将 key 的哈希值进行扰动,以减少哈希冲突的概率。 5. 插入操作 HashMap 的插入操作是通过 put() 方法实现的。具体来说,它会先计算出 key 的哈希值,然后根据哈希值计算出在数组中的位置。如果该位置是空的,就直接将 Entry 对象插入到该位置;否则,就在该位置对应的链表(或红黑树)中查找是否已经存在具有相同 key 的 Entry 对象,如果存在,则更新其 value 值,否则将新的 Entry 对象插入到链表(或红黑树)的末尾。 6. 查找操作 HashMap 的查找操作是通过 get() 方法实现的。具体来说,它会先计算出 key 的哈希值,然后根据哈希值计算出在数组中的位置。如果该位置为空,就直接返回 null;否则,就在该位置对应的链表(或红黑树)中查找是否存在具有相同 key 的 Entry 对象,如果存在,则返回其 value 值,否则返回 null。 7. 删除操作 HashMap 的删除操作是通过 remove() 方法实现的。具体来说,它会先计算出 key 的哈希值,然后根据哈希值计算出在数组中的位置。然后,在该位置对应的链表(或红黑树)中查找是否存在具有相同 key 的 Entry 对象,如果存在,则将其删除,否则什么也不做。 8. 总结 以上就是 JDK 8 中 HashMap 的码详解。需要注意的是,哈希表虽然可以加快查找的速度,但是在处理哈希冲突、扩容等问题上也存在一定的复杂性,因此在使用 HashMap 时需要注意其内部实现细节,以便更好地理解其性能和使用方法。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值