HashMap

最新推荐文章于 2022-03-09 15:20:28 发布

卜思凡

最新推荐文章于 2022-03-09 15:20:28 发布

阅读量97

点赞数

分类专栏：集合

本文链接：https://blog.csdn.net/a534469632/article/details/107432475

版权

集合专栏收录该内容

4 篇文章 0 订阅

订阅专栏

1.并发下HashMap为什么不是线程安全的？解决方法？

一、多线程put的时候可能导致元素丢失
在多线程下put操作时，执行addEntry(hash, key, value, i)，如果有产生哈希碰撞，导致两个线程得到同样的bucketIndex去存储，就可能会出现覆盖丢失的情况。
二、
1.Hashmap在插入元素过多的时候需要进行Resize，Resize的条件是
HashMap.Size >= Capacity * LoadFactor。
2.Hashmap的Resize包含扩容和ReHash两个步骤:
扩容
创建一个新的Entry空数组，长度是原hashMap数组的2倍；
ReHash
因为长度变长，Hash的规则也随之改变了。所以要遍历原Entry数组，把所有的Entry重新Hash到新的数组。
ReHash在并发的情况下可能会形成链表环（1.7之前头插法，1.8之后用了尾插法解决了）。 导致程序在执行get操作时形成死循环
并发问题：
若当前线程此时获得ertry节点，但是被线程中断无法继续执行，此时线程二进入transfer函数，并把函数顺利执行，此时新表中的某个位置有了节点，之后线程一获得执行权继续执行，因为并发transfer，所以两者都是扩容的同一个链表，当线程一执行到e.next = new table[i] 的时候，由于线程二之前数据迁移的原因导致此时new table[i] 上就有ertry存在，所以线程一执行的时候，会将next节点，设置为自己，导致自己互相使用next引用对方，因此产生链表，导致死循环。
解决方法：
1.使用java.util.collections.synchronizedMap()方法包装 HashMap,得到线程安全的Map
2.使用concurrentHashmap来解决。

2.ConcurrentHashMap 线程安全的具体实现方式/底层具体实现

JDK1.7
首先将数据分为一段一段的存储，然后给每一段数据配一把锁，当一个线程占用锁访问其中一个段数据时，其他段的数据也能被其他线程访问。
ConcurrentHashMap 是由 Segment 数组结构和 HashEntry 数组结构组成。
Segment 实现了 ReentrantLock,所以 Segment 是一种可重入锁，扮演锁的角色。HashEntry 用于存储键值对数据。当对 HashEntry 数组的数据进行修改时，必须首先获得对应的 Segment 的锁。
JDK1.8
ConcurrentHashMap 取消了 Segment 分段锁，采用 CAS 和 synchronized 来保证并发安全。数据结构跟 HashMap1.8 的结构类似，数组+链表/红黑二叉树。
synchronized 只锁定当前链表或红黑二叉树的首节点，这样只要 hash 不冲突，就不会产生并发，效率又提升 N 倍。

3.ConcurrentHashMap 和 Hashtable 的区别

ConcurrentHashMap 和 Hashtable 的区别主要体现在实现线程安全的方式上不同。

底层数据结构： JDK1.7 的 ConcurrentHashMap 底层采用分段的数组+链表实现，JDK1.8 采用的数据结构跟 HashMap1.8 的结构一样，数组+链表/红黑二叉树。Hashtable 和 JDK1.8 之前的 HashMap 的底层数据结构类似都是采用数组+链表的形式，数组是 HashMap 的主体，链表则是主要为了解决哈希冲突而存在的；
实现线程安全的方式（重要）： ① 在 JDK1.7 的时候，ConcurrentHashMap（分段锁）对整个桶数组进行了分割分段(Segment)，每一把锁只锁容器其中一部分数据，多线程访问容器里不同数据段的数据，就不会存在锁竞争，提高并发访问率。 到了 JDK1.8 的时候已经摒弃了 Segment 的概念，而是直接用 Node 数组+链表+红黑树的数据结构来实现，并发控制使用 synchronized 和 CAS 来操作。（JDK1.6 以后对 synchronized 锁做了很多优化）整个看起来就像是优化过且线程安全的 HashMap，虽然在 JDK1.8 中还能看到 Segment 的数据结构，但是已经简化了属性，只是为了兼容旧版本；② **Hashtable(同一把锁) :使用 synchronized 来保证线程安全，效率非常低下。**当一个线程访问同步方法时，其他线程也访问同步方法，可能会进入阻塞或轮询状态，如使用 put 添加元素，另一个线程不能使用 put 添加元素，也不能使用 get，竞争会越来越激烈效率越低。

4.HashMap 的 hash 算法的实现原理（为什么右移 16 位，为什么要使用 ^ 位异或）

从我们的角度来讲，只要知道这是为了更好的均匀散列表的下标就好了，我们来看看 HashMap 的 hash 算法（JDK 8）.

 static final int hash(Object key) {
  		int h;
	    return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
 }

深入理解 hashcode() 和 HashMap 中的hash 算法

5.HashMap 的容量为什么建议是 2的幂次方？

put时根据hash计算下标的方法：(n - 1) & hash；
当 n 为 2 的幂次方的时候，减一之后就会得到 1111* 的数字，才能最大限度的利用 hash 值，并更好的散列，只有全是1 ，才能有更多的散列结果。

卜思凡

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
HashMap

1.并发下HashMap为什么不是线程安全的？解决方法？一、多线程put的时候可能导致元素丢失在多线程下put操作时，执行addEntry(hash, key, value, i)，如果有产生哈希碰撞，导致两个线程得到同样的bucketIndex去存储，就可能会出现覆盖丢失的情况。二、1.Hashmap在插入元素过多的时候需要进行Resize，Resize的条件是HashMap.Size >= Capacity * LoadFactor。2.Hashmap的Resize包含扩容和Re
复制链接

扫一扫