深入了解HashMap底层原理

深入了解HashMap底层原理

HashMap的常用方法

方法和描述修饰符和返回值类型
clear() 从Map集合中删除所有的映射。void
containsKey(Object key) 如果此映射包含指定键的映射,则返回 trueboolean
containsValue(Object value) 如果此地图将一个或多个键映射到指定值,则返回 trueboolean
get(Object key) 返回到指定键所映射的值,或 null如果此映射包含该键的映射。V
isEmpty() 如果此地图不包含键值映射,则返回 true 。 (判断是否为空)boolean
put(K key, V value) 将指定的值与此映射中的指定键相关联。V
remove(Object key) 从该地图中删除指定键的映射(如果存在)。boolean
replace(K key, V value) 只有当目标映射到某个值时,才能替换指定键的条目。V
replace(K key, V oldValue, V newValue) 仅当当前映射到指定的值时,才能替换指定键的条目。boolean
size() 返回此地图中键值映射的数量。int
values() 返回此地图中包含的值的Collection视图。Collection

要了解的数据结构

在数据结构中常见的三种结构:数组、链表、哈希结构(散列表)、这里总结各自特点和它们的优缺点

1、数组

数组:采用一段连续的存储单元来存储数据。

数组的查找图解:

数组的插入和删除图解:

在这里插入图片描述

优点:随机读取和修改效率高,原因是数组是连续的(随机访问性强,查找速度快),时间复杂度为O(1)。

缺点:插入、删除效率低,并且大小固定不易动态扩展时间复杂度为O(n)。

2、链表

链表:是一种物理存储单元上非连续,非顺序的存储结构

链表的查询图解:

在这里插入图片描述

链表的插入和删除图解

在这里插入图片描述

3、哈希结构(散列表)

什么是哈希值:
  • 根据Object.hashCode()可以获得对象的哈希值,
  • 它是一个十进制的整数,由系统随机给出;
  • 是对象的地址值,但这是一个逻辑地址,是模拟出来的;不是数据实际存储的物理地址;
什么是哈希表(散列表)结构

哈希表可以简单理解为存储Key-Value(键值对)映射的集合比如说HashMap底层就是由哈希表构成,我们可以通过Key快速找到对应的Value。

  • jdk1.7中HashMap的底层数据结构是由数组+链表
  • jdk1.8中HashMap的底层数据结构是由数组+链表+红黑树

在这里插入图片描述

此时就有了第二种数据结构——链表,冲突的元素就会以链表的形式放在此索引的位置

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-WEkOEZPJ-1660051210427)(C:\Users\Lenovo\AppData\Roaming\Typora\typora-user-images\image-20220809204839110.png)]

但是,当链表的长度越来越长超过8个的时候就会出现第三种数据结构——红黑树

因为链表的查询效率非常低时间复杂度为O(n),而红黑树的时间复杂度为O(logn),查询的效率远远高于链表。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-A2NeLLHL-1660051210427)(C:\Users\Lenovo\AppData\Roaming\Typora\typora-user-images\image-20220809205843927.png)]

  • 红黑树是一棵接近于平衡的二叉树,其查询时间复杂度为O(logn),远远比链表的查询效率高。

  • 但如果链表长度不到一定的阈值,直接使用红黑树代替链表也是不行的,因为红黑树的自身维护的代价也是比较高的,每插入一个元素都可能打破红黑树的平衡性,这就需要每时每刻对红黑树再平衡(左旋、右旋、重新着色)

HashMap解析

简介

HashMap 是基于哈希表的 Map 接口是实现的。它的值(key)和键(value)允许为null。是无序的,也不能保证顺序一直不变。

请添加图片描述

从源码可以看出HashMap有四个构造器,通过构造器可以看出HashMap有两个默认参数nitialCapacity (初始容量)和loadFactor(加载因子)当用户没有给定值的时候初始容量的值为16,加载因子为0.75,其中初始容量是HashMap刚初始化时的容量,加载因子是对HashMap空间和时间效率的一个平衡,当达到这个值的时候HashMap就会触发扩容。

为什么要这个加载因子

加载因子是对HashMap空间和时间效率的一个平衡, 因为如果跟ArrayList一样等到放不下再进行扩容的时候,某一个Hash的Key所对应的Value链表可能已经很长了,所以使用HashMap使用空间加载载因子的方式进行扩容了,可以避免hash重复,从而提升查询的效率。

分析HashMap的put(K key,V value)方法源码

//实现Map.put和相关方法
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
        //tab 哈希数组,p 该哈希桶的首节点,n hashMap的长度,i 计算出的数组下标
        Node<K,V>[] tab; Node<K,V> p; int n, i;
        //获取长度并进行扩容,使用的是懒加载,table一开始是没有加载的,等put后才开始加载
        if ((tab = table) == null || (n = tab.length) == 0)
            n = (tab = resize()).length;
        /**如果计算出的该哈希桶的位置没有值,则把新插入的key-value放到此处,此处就算没有插入成功,也就是发生哈希冲突时也会把哈希桶的首节点赋予p**/
        if ((p = tab[i = (n - 1) & hash]) == null)
            tab[i] = newNode(hash, key, value, null);
        //发生哈希冲突的几种情况
        else {
            // e 临时节点的作用, k 存放该当前节点的key 
            Node<K,V> e; K k;
            //第一种,插入的key-value的hash值,key都与当前节点的相等,e = p,则表示为首节点
            if (p.hash == hash &&
                ((k = p.key) == key || (key != null && key.equals(k))))
                e = p;
            //第二种,hash值不等于首节点,判断该p是否属于红黑树的节点
            else if (p instanceof TreeNode)
                /**为红黑树的节点,则在红黑树中进行添加,如果该节点已经存在,则返回该节点(不为null),该值很重要,用来判断put操作是否成功,如果添加成功返回null**/
                e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
            //第三种,hash值不等于首节点,不为红黑树的节点,则为链表的节点
            else {
                //遍历该链表
                for (int binCount = 0; ; ++binCount) {
                    //如果找到尾部,则表明添加的key-value没有重复,在尾部进行添加
                    if ((e = p.next) == null) {
                        p.next = newNode(hash, key, value, null);
                        //判断是否要转换为红黑树结构
                        if (binCount >= TREEIFY_THRESHOLD - 1) 
                            treeifyBin(tab, hash);
                        break;
                    }
                    //如果链表中有重复的key,e则为当前重复的节点,结束循环
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        break;
                    p = e;
                }
            }
            //有重复的key,则用待插入值进行覆盖,返回旧值。
            if (e != null) { 
                V oldValue = e.value;
                if (!onlyIfAbsent || oldValue == null)
                    e.value = value;
                afterNodeAccess(e);
                return oldValue;
            }
        }
        //到了此步骤,则表明待插入的key-value是没有key的重复,因为插入成功e节点的值为null
        //修改次数+1
        ++modCount;
        //实际长度+1,判断是否大于临界值,大于则扩容
        if (++size > threshold)
            resize();
        afterNodeInsertion(evict);
        //添加成功
        return null;
    }

流程图:
在这里插入图片描述

HashMap的扩容机制

  • 空参数的构造函数:实例化的HashMap默认内部数组是null,即没有实例化。第一次调用put方法时,则会开始第一次初始化扩容,长度为16。

  • 有参构造函数:用于指定容量。会根据指定的正整数找到不小于指定容量的2的幂数,将这个数设置赋值给阈值(threshold)。第一次调用put方法时,会将阈值赋值给容量,然后让 阈值=容量*负载因子。(因此并不是我们手动指定了容量就一定不会触发扩容,超过阈值后一样会扩容!!)

  • 如果不是第一次扩容,则容量变为原来的2倍,阈值也变为原来的2倍。(容量和阈值都变为原来的2倍时,负载因子还是不变)

此外还有几个细节需要注意:

  • 首次put时,先会触发扩容(算是初始化),然后存入数据,然后判断是否需要扩容;
    后让 阈值=容量*负载因子。(因此并不是我们手动指定了容量就一定不会触发扩容,超过阈值后一样会扩容!!)

  • 如果不是第一次扩容,则容量变为原来的2倍,阈值也变为原来的2倍。(容量和阈值都变为原来的2倍时,负载因子还是不变)

此外还有几个细节需要注意:

  • 首次put时,先会触发扩容(算是初始化),然后存入数据,然后判断是否需要扩容;
  • 不是首次put,则不再初始化,直接存入数据,然后判断是否需要扩容;

手写HashMap源码

public class MyHashMap<K,V> {
    private Entry[] entrys=new Entry[100];//简单版的,所以在这里就初始化容量(其实不能这样)

    class Entry<K,V>{
        K k;
        V v;
        int hash;
        Entry<K,V> next;

        public Entry(K k, V v, Entry<K, V> next, int hash) {
            this.k = k;
            this.v = v;
            this.hash = hash;
            this.next = next;
        }
    }

    public void put(K k,V v){
        int hash=k.hashCode();//获取key的HashCode值
        int index = hash % entrys.length;//用HashCode值与整个数组的长度取模
        Entry oldEntry = entrys[index];//将当前索引的值赋值给oldEntry
        if (oldEntry == null) {//判断当前索引的值是否为空
            entrys[index]=new Entry(k,v,null,hash);//如果当前索引的值为空说明此处没有值,就将当前的值填入当前索引
            
        }else {
            entrys[index]=new Entry(k,v,oldEntry,hash);//如果不为空就说明当前索引有值,将此索引位置变为链表结构,就用oldEntry.next指向当前放入的值
        }

    }

    public V get(K k){
        int index=k.hashCode()%entrys.length;
        
        for (Entry entry = entrys[index];entry!=null;entry=entry.next){
            if (entry.hash==k.hashCode()&&(entry.k==k||entry.k.equals(k))){
                return (V) entry.v;
            }
        }
        return null;
    }
}
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值