HashMap源码分析-jdk1.6和jdk1.8的区别

最新推荐文章于 2023-08-18 15:25:18 发布

weixin_34081595

最新推荐文章于 2023-08-18 15:25:18 发布

阅读量446

点赞数

文章标签： java python 数据结构与算法

原文链接：https://my.oschina.net/mengyuankan/blog/1618077

版权

2019独角兽企业重金招聘Python工程师标准>>>

在java集合中，HashMap是用来存放一组键值对的数，也就是key-value形式的数据，而在jdk1.6和jdk1.8的实现有所不同。

JDK1.6的源码实现：

首先来看一下HashMap的类的定义：

public class HashMap<K,V> extends AbstractMap<K,V> implements Map<K,V>, Cloneable, Serializable

HashMap继承了AbstractHashMap，实现了Map，Cloneable和Serializable接口，Map定义了一些公共的接口，而AbstractHashMap也实现了Map接口，并提供了一些默认的实现，如size方法和isEmpty方法等

在HashMap中，定义了几个常量：

static final int DEFAULT_INITIAL_CAPACITY = 16

初始容量，如果在创建HashMap的时候没有指定容量，就使用初始容量

static final int MAX_CAPACITY = 1 << 30

最大容量，HashMap中存储元素的数组的最大的容量，为2的30次方

static final float DEFAULT_LOAD_FACTOR = 0.75F

默认的加载因子，在扩容的时候使用

transient Entry[] table

最重要的一个常量，用来存放我们添加的元素，

int threshold

阈值,用来判断HashMap是否需要扩容，如果添加的元素超过该值，则需要扩容，该值等于 capacity * loadFactor，比如默认的初始容量为16，默认的加载因子为0.75，则阈值就等于16*0.75=12，在table数组中，如果数组的元素个数超过12，则table数组就需要进行扩容。

HashMap提供了三个构造方法，我们可以指定初始容量和加载因子来构造HashMap

public HashMap(int initialCapacity, float loadFactor)

也可以只指定初始容量来构造HashMap

public HashMap(int initialCapacity)

也可以都不指定，这时，初始容量和加载因子都是用的默认的值，一般情况下也不会去指定初始容量和加载因子。


    public HashMap() {
        this.loadFactor = DEFAULT_LOAD_FACTOR;
        threshold = (int)(DEFAULT_INITIAL_CAPACITY * DEFAULT_LOAD_FACTOR);
        table = new Entry[DEFAULT_INITIAL_CAPACITY];
        //该方法是一个钩子方法，是一个空方法
        init();
    }

如果采用不带参数的构造方法，可以看到存放元素的初始数组的大小为16，阈值为12。
相当于 Entry[] table = new Entry[16]，在HashMap内部使用 Entry数组来存放元素的。

    static class Entry<K,V> implements Map.Entry<K,V> {
        final K key;
        V value;
        Entry<K,V> next;
        final int hash;
		//省略其他的代码
	｝

可以看到Entry表示的是一个单向链表的结构，next就是指向下一个节点；也就是说在HashMap内部，使用数组+链表的形式来存放元素，数组的每一项就是一个链表。HashMap的结构图大致如下所示：

接下来看一下对HashMap的常用操作：

1. put(key, value)操作，向HashMap中添加元素
1）添加的时候，首先要计算key的hash值，找到对应数组的下标
2）找到该下标对应的数组位置的链表，遍历链表，把值添加到该链表上

    public V put(K key, V value) {
        if (key == null)
            return putForNullKey(value); // 对key为null的处理，HashMap的key可以为null，但只有一个
        int hash = hash(key.hashCode()); //根据key计算出hash值
        int i = indexFor(hash, table.length); // 根据hash值和数组长度计算数组的下标，添加的元素就在该位置上
        //之后，取得该数组位置上的链表
        //遍历链表，如果key已经存在了，则用新的值替换旧的值并返回旧的值
        for (Entry<K,V> e = table[i]; e != null; e = e.next) {
            Object k;
            if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
                V oldValue = e.value;
                e.value = value;
                e.recordAccess(this);
                return oldValue;
            }
        }
        modCount++;
        // 如果key不存在，则会在该链表上添加一个新的Entry节点
        addEntry(hash, key, value, i);
        return null;
    }

addEntry()方法如下：

     void addEntry(int hash, K key, V value, int bucketIndex) {
        //把该位置上的链表赋给一个临时变量，
        Entry<K,V> e = table[bucketIndex];
            //之后，用新添加的key和value来创建一个新的Entry节点，把该节点的下一个节点指向这个临时变量
            table[bucketIndex] = new Entry<K,V>(hash, key, value, e);
            //判断数组是否需要扩容，resize方法是对数组进行扩容
            if (size++ >= threshold)
                resize(2 * table.length);
        }

用图来说明：

1. 初始化一个空的HashMap，此时还没有元素，结构如下：

假设要添加一对数据：key="zs", value="zhangsan"

首先对 key进行hash，比如 hash之后的值为5，之后在用hash和table.length来求数组的索引，

比如索引 i = 4，此时，这对元素就应该在 table[i] 即 table[4] 的位置处，取得该处的Entry链表，此时，链表为空，创建一个Entry节点，加入到该空链表中：

此时，在添加一对元素：key="ls", value="lisi"，假如计算的索引 i 恰好等于4，此时，取得 table[4] 处的链表 Entry<K, V> = table[4]，用key = "ls"在这个链表上进行遍历，看看是否该key已存在：

此时，key="ls"并不存在，又会创建一个Entry节点，加入到该列表中：

如果此时，又添加 key="zs", value="zhangsan222"，根据key计算到的索引为4，取出 table[4]处的链表，遍历链表，然后检查对应的key是否存在，检查到key已经存在了，所以会把新的值替换旧的值即可，不用创建新的节点。

2.get(key)操作
1）根据key计算hash值，根据hash值和数组长度计算数组的下标索引
2）取得该下标对应的链表，遍历链表，找到key对应的value

        public V get(Object key) {
            if (key == null)
                return getForNullKey(); //key为null的键，单独处理，返回对应的值
            int hash = hash(key.hashCode());//计算hash值
            for (Entry<K,V> e = table[indexFor(hash, table.length)]; e != null; e = e.next) {
                Object k;
                if (e.hash == hash && ((k = e.key) == key || key.equals(k)))
                    return e.value;
            }
            return null;
        }

3.remove()操作，
1）根据key计算hash值，根据hash值和数组长度计算数组的下标索引
2）取得该下标对应的链表，遍历链表，删除key对应的Entry节点

	    public V remove(Object key) {
			Entry<K,V> e = removeEntryForKey(key);
			return (e == null ? null : e.value);
		}

removeEntryForKey()方法如下：

	    final Entry<K,V> removeEntryForKey(Object key) {
			int hash = (key == null) ? 0 : hash(key.hashCode());
			int i = indexFor(hash, table.length);
			Entry<K,V> prev = table[i];
			Entry<K,V> e = prev;

			while (e != null) {
				Entry<K,V> next = e.next;
				Object k;
				if (e.hash == hash &&((k = e.key) == key || (key != null && key.equals(k)))) {
					modCount++;
					size--;
					if (prev == e) // 表示删除的是第一个Entry节点
						table[i] = next;
					else
						prev.next = next;
					e.recordRemoval(this);
					return e;
				}
				prev = e;
				e = next;
			}
			// 如果为null，直接返回
			return e;
		}

假设现在HashMap中元素的分布如下：

要删除 key="ls"的元素，假如计算的索引 i=4，要去遍历 table[4]处的链表，删除对应的节点，key="ls"为链表的第一个节点：

以上就是jdk1.6中HashMap的实现，是基于数组+链表的形式来存放数据的。

JDK1.8的源码实现：

在JDK1.8中，HashMap的实现比1.6的实现要复杂得多，1.8中引入了红黑树的数据结构；

除了上面列出来的常量外，新增加了几个常量：

static final int TREEIFY_THRESHOLD = 8;

表示的是，如果数组中链表的元素大于该值，则需要把该链表转化为红黑树，

static final int UNTREEIFY_THRESHOLD = 6;

如果链表中的元素个数小于该值，则把红黑树转换为链表

在JDK1.6中，使用一个Entry数组来存放元素，而在JDK1.8中，使用的Node数组和TreeNode来存放元素，

Node：其实，Node和Entry没有什么区别，

    static class Node<K,V> implements Map.Entry<K,V> {
        final int hash;
        final K key;
        V value;
        Node<K,V> next;

        Node(int hash, K key, V value, Node<K,V> next) {
            this.hash = hash;
            this.key = key;
            this.value = value;
            this.next = next;
        }

TreeNode：表示的是一个红黑树结构

    static final class TreeNode<K,V> extends LinkedHashMap.Entry<K,V> {
        TreeNode<K,V> parent;  // red-black tree links
        TreeNode<K,V> left;
        TreeNode<K,V> right;
        TreeNode<K,V> prev;    // needed to unlink next upon deletion
        boolean red;
        TreeNode(int hash, K key, V val, Node<K,V> next) {
            super(hash, key, val, next);
        }
    }

转载于:https://my.oschina.net/mengyuankan/blog/1618077