HashMap和ConcurrentHashMap详解

最新推荐文章于 2024-06-23 21:06:46 发布

LexSiminor

最新推荐文章于 2024-06-23 21:06:46 发布

阅读量861

点赞数

分类专栏： java基础文章标签： java

本文链接：https://blog.csdn.net/lexsiminor/article/details/120614929

版权

java基础专栏收录该内容

1 篇文章 0 订阅

订阅专栏

Hello大家好，国庆期间给大家来普及一下关于Hash表知识点。

我们日常最多使用的哈希表应该是HashMap，但是很多时候HashMap都被称为是不安全的，并且Hash表有着独特的扩容机制，扩容系数等。。很多小伙伴可能在日常写java的时候并没有听说过这些东西，今天博主给大家整理了一下关于Hash表的知识点，一起来看看吧！

HashMap的安全问题

我们都知道HashMap是线程不安全的，因为在某些多线程的环境下会出现各种各样的问题，例如JDK7的扩容死循环问题，JDK8的链表和树结构转换的死循环问题，所以我们在使用的时候一定要考虑是否会出现并发，这样才能保证程序的正常运行

HashMap在JDK8之前是链表加数组的方式、JDK8之后引入的红黑树

多线程环境下请使用HashTable、ConcurrentHashMap、Collections.sychronizedMap(需要包装的HashMap)

JDK7==>扩容死循环

void transfer(Entry[] newTable, boolean rehash) {
        int newCapacity = newTable.length;
        for (Entry<K,V> e : table) {
            while(null != e) {
                Entry<K,V> next = e.next;
                if (rehash) {
                    e.hash = null == e.key ? 0 : hash(e.key);
                }
                int i = indexFor(e.hash, newCapacity);
                e.next = newTable[i];
                newTable[i] = e;
                e = next;
            }
        }
    }

单线程下扩容方式:

当前节点在新的Hash节点上看是否有别的节点：

①没有、直接插入

②有，指向那个节点。然后自己变成头结点

所以扩容一次，链表就要反转一次

可以看出单线程下是没有问题的

多线程下的问题

分别两个线程都刚好进行扩容，当线程1准备开始扩容的时候突然被打断，线程2抢到CPU，进行扩容，此时线程1-2两个线程中都是1->2没错吧，然后线程2扩容，链表变成了3->2->1,此时线程1拿到CPU，进行扩容，

第一遍For循环(e = 3) --> 此时1->2->3;
3.next = null;
null = 3;
e = 2;

第二遍
2.next = 3;
2 = e;
e = 1;

--> 1.next = 2 2.next = 1;

因为此代码

while(null != e) {
                Entry<K,V> next = e.next;
                if (rehash) {
                    e.hash = null == e.key ? 0 : hash(e.key);
                }
                int i = indexFor(e.hash, newCapacity);
                e.next = newTable[i];
                newTable[i] = e;
                e = next;
            }

JDK8的时候是红黑树的死循环问题，这里就不赘述了(其实是博主自己也没搞明白,2333)

所以在多线程的环境下请使用ConcurrentHashMap(强烈推荐)

CocurrentHashMap可以看作线程安全且高效的HashMap，相比于HashMap具有线程安全的优势，相比于HashTable具有效率高的优势。

而ConcurrentHashMap在JDK7和JDK8中也是不同的

JDK7

在JDK1.7版本中，ConcurrentHashMap的数据结构是由一个Segment数组和多个HashEntry数组组成，Segment存储的是链表数组的形式，如图所示。

从上图可以看出，ConcurrentHashMap定位一个元素的过程需要两次Hash的过程，第一次Hash的目的是定位到Segment，第二次Hash的目的是定位到链表的头部。两次Hash所使用的时间比一次Hash的时间要长，但这样做可以在写操作时，只对元素所在的segment加锁，不会影响到其他segment，这样可以大大提高并发能力。

JDK8

1.8在链表长度超过8并且表长度大于64的时候会变成红黑树来保证时间复杂度平衡

ConcurrentHashMap的缺点

因为保证效率每次只会锁部分数据，而并不会锁住整个表，读取也不会保证读取到最新，只能保证读取到已经顺利插入的数据。(这玩意很像数据的可重复读)

这里我使用CountDownLatch来等待线程结束后-->提交后

然后发现在被修改的时候依旧可以查询到数据-->不过是提交前的

这就有可能会导致数据不一致性问题(弱一致性)-->可以通过上锁来解决Sychronized/CAS

public class ConcurrentHashMapAndHashMap {

    private static CountDownLatch countDownLatch = new CountDownLatch(1);

    public static void main(String[] args) {
        ConcurrentHashMap<Integer, Integer> concurrentHashMap = new ConcurrentHashMap<>();
        try {
            //ConcurrentHashMap是不能传入空的
            concurrentHashMap.put(1, 1);
            concurrentHashMap.put(2, 2);
            concurrentHashMap.put(3, 3);
            System.out.println("未修改时查询: ");
            for (Map.Entry<Integer, Integer> entry: concurrentHashMap.entrySet()) {
                System.out.println(entry.getKey() + " -- " + entry.getValue());
            }
        }catch (NullPointerException e) {
            System.out.println("空指针");
        }

        new Thread(()-> {
            concurrentHashMap.put(2, 15);
            try {
                Thread.sleep(2000);
                countDownLatch.countDown();
            } catch (InterruptedException e) {
                e.printStackTrace();
            }
        }).start();
        System.out.println("修改时查询: ");
        for (Map.Entry<Integer, Integer> entry: concurrentHashMap.entrySet()) {
            System.out.println(entry.getKey() + " -- " + entry.getValue());
        }

        try {
            countDownLatch.await();
        } catch (InterruptedException e) {
            e.printStackTrace();
        }
        System.out.println("修改后查询: ");
        for (Map.Entry<Integer, Integer> entry: concurrentHashMap.entrySet()) {
            System.out.println(entry.getKey() + " -- " + entry.getValue());
        }

    }

}

ConcurrentHashMap为了保证线程安全还不允许插入Null值

ConCurrentHashMap中的key和value为null会出现空指针异常，而HashMap中的key和value值是可以为null的。

原因如下：

ConCurrentHashMap是在多线程场景下使用的，如果ConcurrentHashMap.get(key)的值为null，那么无法判断到底是key对应的value的值为null还是不存在对应的key值。

而在单线程场景下的HashMap中，可以使用containsKey(key)来判断到底是不存在这个key还是key对应的value的值为null。

在多线程的情况下使用containsKey(key)来做这个判断是存在问题的，因为在containsKey(key)和ConcurrentHashMap.get(key)两次调用的过程中，key的值已经发生了改变。

就比如我们默认用get方法来取值，没有这个值取出来是Null，但是如果你插入这个Null数据然后查询的时候因为其他线程抢到CPU直接把数据Remove之后你再查还是Null，这个时候你就不知道这个数据到底是存在还是不存在了

HashMap的扩容机制

每次HashMap扩容都是扩容2倍，

原因:

1、因为是数组加链表-->所以我们插入每个数据都要进行取模，因为Hash表的大小始终为2的n次幂，因此可以将取模转为位运算操作，容量n为2的幂次方，n-1的二进制都变成1，这个时候可以充分散列，减少hash碰撞。

扩容代码

newTab[e.hash & (newCap - 1)] = e;

2、是否移位，由扩容后表示的最高位是否1为所决定，并且移动的方向只有一个，即向高位移动。因此，可以根据对最高位进行检测的结果来决定是否移位，从而可以优化性能，不用每一个元素都进行移位。

HashMap扩容因子

hashMap的扩容因子是0.75,因为符合泊松分布，这个大小的时候扩容hash碰撞是最小的，

加载因子过高，例如为1，虽然减少了空间开销，提高了空间利用率，但同时也增加了查询时间成本；

加载因子过低，例如0.5，虽然可以减少查询时间成本，但是空间利用率很低，同时提高了rehash操作的次数。

正好讲到了Hash碰撞

常用的解决hash碰撞的方法有

1、拉链法 --> 变成链表串起来

2、开放定址法-->

①：线性探查法：就是当前位置有值了就向右移动直到找到没有碰撞的位置

②：线性补偿探测法：di=Ｑ　下一个位置满足 Hi=(H(key) + Ｑ) mod m i=1,2,...k(k<=m-1) ，要求 Q 与 m 是互质的，以便能探测到哈希表中的所有单元。

缺点：这种方法在冲突严重的时候会影响查找删除的效率

3、Rehash

LexSiminor

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
HashMap和ConcurrentHashMap详解

Hello大家好，国庆期间给大家来普及一下关于Hash表知识点。我们日常最多使用的哈希表应该是HashMap，但是很多时候HashMap都被称为是不安全的，并且Hash表有着独特的扩容机制，扩容系数等。。很多小伙伴可能在日常写java的时候并没有听说过这些东西，今天博主给大家整理了一下关于Hash表的知识点，一起来看看吧！HashMap的安全问题我们都知道HashMap是线程不安全的，因为在某些多线程的环境下会出现各种各样的问题，例如JDK7的扩容死循环问题，JDK8的链表和树结构转换的死循
复制链接

扫一扫

专栏目录