HashMap原理及源码分析

最新推荐文章于 2022-04-17 11:42:22 发布

Teddy1982

最新推荐文章于 2022-04-17 11:42:22 发布

阅读量84

点赞数

分类专栏： Java Core

Java Core 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

什么是HashMap?

数据结构的物理存储结构有两种顺序存储结构和链式存储结构, 在数组中根据下标查询元素, 一次定位就可以获得O(1), 性能十分优秀, HashMap正是依据数组为主体的数据结构.

如果我们要新增或是定位某个元素, 将这个元素的关键字通过某个函数映射到数组的某个位置, 这样通过数组下标一次定位就可以完成操作

存储位置=f(关键字)

这个函数f一般称为哈希函数, 这个函数的设计好坏会直接影响哈希表的性能。

源码分析

HashMap的主干是一个Entry数组。Entry是HashMap的基本组成单元, 每一个Entry包含一个key-value键值对。

//HashMap的主干数组，可以看到就是一个Entry数组，初始值为空数组{}，主干数组的长度一定是2的次幂
transient Entry<K,V>[] table = (Entry<K,V>[]) EMPTY_TABLE;

Entry是HashMap中的一个静态内部类

    static class Entry<K,V> implements Map.Entry<K,V> {
        final K key;
        V value;
        Entry<K,V> next;//存储指向下一个Entry的引用，单链表结构
        int hash;//对key的hashcode值进行hash运算后得到的值，存储在Entry，避免重复计算

        /**
         * Creates new entry.
         */
        Entry(int h, K k, V v, Entry<K,V> n) {
            value = v;
            next = n;
            key = k;
            hash = h;
        }

HashMap是由数组加链表组成的, 数组是HashMap的主体, 链表是为了解决哈希冲突而存在的, 如果定位到的数组位置不含链表, 那么对于查找, 添加等操作很快, 仅需要一次寻址即可; 如果定位到的数组位置包含链表, 对于添加操作, 其时间复杂度为O(n), 首先遍历链表, 存在即覆盖, 否则新增; 对于查找操作来说, 仍然需要遍历链表, 然后通过key对象的equals方法进行一一比对查找。所以, HashMap中的链表出现越少越好。

//实际存储的key-value键值对的个数
transient int size;
//阈值，当table == {}时，该值为初始容量（初始容量默认为16）；当table被填充了，也就是为table分配内存空间后，threshold一般为 capacity*loadFactory。HashMap在进行扩容时需要参考threshold，后面会详细谈到
int threshold;
//负载因子，代表了table的填充度有多少，默认是0.75
final float loadFactor;
//用于快速失败，由于HashMap非线程安全，在对HashMap进行迭代时，如果期间其他线程的参与导致HashMap的结构发生变化了（比如put，remove等操作），需要抛出异常ConcurrentModificationException
transient int modCount;

HashMap共有4个构造器, 其他构造器如果没有传入initialCapacity和loadFactor这两个参数, 会使用默认值initialCapacity默认16, loadFactor默认为0.75

public HashMap(int initialCapacity, float loadFactor) {
        if (initialCapacity < 0)
            throw new IllegalArgumentException("Illegal initial capacity: " +
                                               initialCapacity);
        if (initialCapacity > MAXIMUM_CAPACITY)
            initialCapacity = MAXIMUM_CAPACITY;
        if (loadFactor <= 0 || Float.isNaN(loadFactor))
            throw new IllegalArgumentException("Illegal load factor: " +
                                               loadFactor);

        this.loadFactor = loadFactor;
        threshold = initialCapacity;
　　　　　
        init();//init方法在HashMap中没有实际实现，不过在其子类如 linkedHashMap中就会有对应实现
    }

在常规构造器中, 没有为数组table分配内存空间, 而是在执行put操作的时候才真正构建table数组

public V put(K key, V value) {
        //如果table数组为空数组{}，进行数组填充（为table分配实际内存空间），入参为threshold，此时threshold为initialCapacity 默认是1<<4(24=16)
        if (table == EMPTY_TABLE) {
            inflateTable(threshold);
        }
       //如果key为null，存储位置为table[0]或table[0]的冲突链上
        if (key == null)
            return putForNullKey(value);
        int hash = hash(key);//对key的hashcode进一步计算，确保散列均匀
        int i = indexFor(hash, table.length);//获取在table中的实际位置
        for (Entry<K,V> e = table[i]; e != null; e = e.next) {
        //如果该对应数据已存在，执行覆盖操作。用新value替换旧value，并返回旧value
            Object k;
            if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
                V oldValue = e.value;
                e.value = value;
                e.recordAccess(this);
                return oldValue;
            }
        }
        modCount++;//保证并发访问时，若HashMap内部结构发生变化，快速响应失败
        addEntry(hash, key, value, i);//新增一个entry
        return null;
    }

先看看inflateTable这个方法

private void inflateTable(int toSize) {
        int capacity = roundUpToPowerOf2(toSize);//capacity一定是2的次幂
        threshold = (int) Math.min(capacity * loadFactor, MAXIMUM_CAPACITY + 1);//此处为threshold赋值，取capacity*loadFactor和MAXIMUM_CAPACITY+1的最小值，capaticy一定不会超过MAXIMUM_CAPACITY，除非loadFactor大于1
        table = new Entry[capacity];
        initHashSeedAsNeeded(capacity);
    }

inflateTable这个方法用于为主干table在内存中分配内存空间, 通过roundUpToPowerOf2(toSize)可以确保capacity为大于或等于toSize的最接近toSize的二次幂, 比如toSize=13, 则capacity=16, to_size=16, capacity=16; to_size=17, capacity=32.

private static int roundUpToPowerOf2(int number) {
        // assert number >= 0 : "number must be non-negative";
        return number >= MAXIMUM_CAPACITY
                ? MAXIMUM_CAPACITY
                : (number > 1) ? Integer.highestOneBit((number - 1) << 1) : 1;
    }

roundUpToPowerOf2使得数组长度一定为2的次幂, Integer.highestOneBit是用来获取最左边的bit(其他bit位位0)所代表的数值

addEntry的实现

void addEntry(int hash, K key, V value, int bucketIndex) {
        if ((size >= threshold) && (null != table[bucketIndex])) {
            resize(2 * table.length);//当size超过临界阈值threshold，并且即将发生哈希冲突时进行扩容
            hash = (null != key) ? hash(key) : 0;
            bucketIndex = indexFor(hash, table.length);
        }

        createEntry(hash, key, value, bucketIndex);
    }

当发生哈希冲突并且size大于阈值的时候, 需要进行数组扩容, 扩容时, 需要新建一个长度为之前数组2倍的数组, 然后将当前的Entry数组中的元素全部拷贝过去, 扩容后的新数组长度为之前的2倍, 所以扩容相对来说是个耗资源的操作

Teddy1982

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
HashMap原理及源码分析

什么是HashMap?数据结构的物理存储结构有两种顺序存储结构和链式存储结构, 在数组中根据下标查询元素, 一次定位就可以获得O(1), 性能十分优秀, HashMap正是依据数组为主体的数据结构.如果我们要新增或是定位某个元素, 将这个元素的关键字通过某个函数映射到数组的某个位置, 这样通过数组下标一次定位就可以完成操作存储位置=f(关键字)这个函数f一般称为哈希函数, 这个函...
复制链接

扫一扫