HashMap源码分析&底层数据结构分析

   HashMap 主要用来存放键值对,它基于哈希表的 Map 接口实现,是常用的 Java 集合之一,是非线程安全的。HashMap 可以存储 null 的 key 和 value,但 null 作为键只能有一个,null 作为值可以有多个。

    影响HashMap的性能: 初始数组容量16(inital capacity)和负载系数(load factor)0.75,超过容量*0.75 就会自动扩容,每次扩容是原来容量的2倍。容量是指存储的键值对的数量。
    Java7中Hashmap底层采用的是Entry对数组,1.8之后是Node对象数组。
   Java7 是先扩容后插入新值的,Java8 先插值再扩容。
    HashMap 通过 key 的 hashCode 经过扰动函数处理过后得到 hash 值,然后通过 (n - 1) & hash 判断当前元素存放的位置(这里的 n 指的是数组的长度),如果当前位置存在元素的话,就判断该元素与要存入的元素的 hash 值以及 key 是否相同,如果相同的话,直接覆盖,不相同就通过拉链法解决冲突。链表则是主要为了解决哈希冲突而存在的。
    
    扰动函数指的就是 HashMap 的 hash 方法。使用 hash 方法也就是扰动函数是为了防止一些实现比较差的 hashCode() 方法 换句话说使用扰动函数之后可以减少碰撞。

    拉链法:将链表和数组相结合。也就是说将当前数组中的键值对改变成链表形式,然后将冲突的键值对加到链表中(采用头插法插入元素)。不同就采用头插法插入元素。JDK1.8 以后的 HashMap ,当链表长度大于阈值(默认为 8)并且数组的长度大于等于64,会将链表转换成红黑树;如果当前数组的长度小于 64,那么会选择先进行数组扩容。

   每次扩容,相当于重新创建个指定大小的数组,会伴随着一次重新 hash 分配,并且会遍历 hash 表中所有的元素,是非常耗时的。在编写程序中,要尽量避免 resize。

   HashMap在多线程情况下会导致死循环,主要原因在于并发下调用 resize() 方法里的 rehash() 时,容易出现环形链表。这样当获取一个不存在的 key 时,计算出的 index 正好是环形链表的下标时就会出现死循环。不过,jdk 1.8 后解决了这个问题,但是还是不建议在多线程下使用 HashMap,因为多线程下使用 HashMap 还是会存在其他问题比如数据丢失。并发环境下推荐使用 ConcurrentHashMap。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值