ConcurrentHashMap简单解释

最新推荐文章于 2024-05-01 19:17:00 发布

O.Decipline

最新推荐文章于 2024-05-01 19:17:00 发布

阅读量232

点赞数

文章标签： java jvm 算法

本文链接：https://blog.csdn.net/O_Dentist/article/details/130586995

版权

ConCurrentHashMap

1.扩容原理

在初始化时如果不传参则为16的默认长度（确保线程安全）
如果传参为24，执行构造方法，长度更替为32

2.sizeCtl的四种情况

sizeCtl ==0 记录初始容量 16
sizeCtl 为正数，记录数组扩容阈值。（数组的初始容量*0.75）
sizeCtl 为负数， 表示正在初始化
sizeCtl 为小于0且不为-1，表示正在扩容，记录正在扩容的线程个数  -（1+n）个线程。
concurrenthashmap不允许有空值空键。但是hashmap可以。
总之在小于0的情况下，必定是初始化

        private final Node<K,V>[] initTable() {
        Node<K,V>[] tab; int sc;
        while ((tab = table) == null || tab.length == 0) {
            if ((sc = sizeCtl) < 0)
                Thread.yield(); // lost initialization race; just spin
            else if (U.compareAndSwapInt(this, SIZECTL, sc, -1)) {
                try {
                    if ((tab = table) == null || tab.length == 0) {
                        int n = (sc > 0) ? sc : DEFAULT_CAPACITY;
                        @SuppressWarnings("unchecked")
                        Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n];
                        table = tab = nt;
                        sc = n - (n >>> 2);
                    }
                } finally {
                    sizeCtl = sc;
                }
                break;
            }
        }
        return tab;
    }

如果sizeCtl小于0，当前线程会释放，如果大于0，则会再次判断一下是否为空或者长度为0，防止二次初始化。

sc = n - (n >>> 2);

这一句算的就是0.75*初始值，实际上就是扩容阈值。

一下为PUT法方

 for (Node<K,V>[] tab = table;;) {
            Node<K,V> f; int n, i, fh;
            if (tab == null || (n = tab.length) == 0)
                tab = initTable();
            else if ((f = tabAt(tab, i = (n - 1) & hash)) == null) {
                if (casTabAt(tab, i, null,
                             new Node<K,V>(hash, key, value, null)))
                    break;                   // no lock when adding to empty bin
            }

与原HashMap不同的地方是如果该索引为空的话，则会执行cas操作，即两个线程同时进入该方法，如果线程1成功，则2不成功。

补充：CAS 指令

CAS （Compare And Swap）指令是一个CPU层级的原子性操作指令。在 Intel 处理器中，其汇编指令为 cmpxchg。
该指令概念上存在 3 个参数，第一个参数【目标地址】，第二个参数【值1】，第三个参数【值2】，指令会比较【目标地址存储的内容】和【值1】是否一致，如果一致，则将【值 2】填写到【目标地址】，其语
义可以用如下的伪代码表示。

多线程协助扩容

synchronized (f) {
                    if (tabAt(tab, i) == f) {
                        if (fh >= 0) {
                            binCount = 1;
                            for (Node<K,V> e = f;; ++binCount) {
                                K ek;
                                if (e.hash == hash &&
                                    ((ek = e.key) == key ||
                                     (ek != null && key.equals(ek)))) {
                                    oldVal = e.val;
                                    if (!onlyIfAbsent)
                                        e.val = value;
                                    break;
                                }
                                Node<K,V> pred = e;
                                if ((e = e.next) == null) {
                                    pred.next = new Node<K,V>(hash, key,
                                                              value, null);
                                    break;
                                }
                            }
                        }
                        else if (f instanceof TreeBin) {
                            Node<K,V> p;
                            binCount = 2;
                            if ((p = ((TreeBin<K,V>)f).putTreeVal(hash, key,
                                                           value)) != null) {
                                oldVal = p.val;
                                if (!onlyIfAbsent)
                                    p.val = value;
                            }
                        }
                    }
                }

在这里加锁，加的是某一个slot对象，这个slot桶对象会阻止多线程对同一个slot不停添加单链表元素。这里也是与hashtable有所区别的地方，hashtable是直接把所有的桶都锁起来，只能对单个slot进行单线程操作。

syn下的第一个if判断是判断该结点是否变成了RB树，如果变成了RB树，则树的根节点可能会和该锁的锁对象f结点不同，所以要判断。

之后会判断Hash值是否大于0，如果大于0为普通的链表结构。
在这里插入图片描述

CounterCell[] as; long b, s;
        if ((as = counterCells) != null ||
            !U.compareAndSwapLong(this, BASECOUNT, b = baseCount, s = b + x)) {
            CounterCell a; long v; int m;
            boolean uncontended = true;
            if (as == null || (m = as.length - 1) < 0 ||
                (a = as[ThreadLocalRandom.getProbe() & m]) == null ||
                !(uncontended =
                  U.compareAndSwapLong(a, CELLVALUE, v = a.value, v + x))) {
                fullAddCount(x, uncontended);
                return;
            }

维护集合长度（cas+自旋）

 final long sumCount() {
        CounterCell[] as = counterCells; CounterCell a;
        long sum = baseCount;
        if (as != null) {
            for (int i = 0; i < as.length; ++i) {
                if ((a = as[i]) != null)
                    sum += a.value;
            }
        }
        return sum;
    }

返回数组长度

private final void addCount(long x, int check) {
        CounterCell[] as; long b, s;
        if ((as = counterCells) != null ||
            !U.compareAndSwapLong(this, BASECOUNT, b = baseCount, s = b + x)) {
            CounterCell a; long v; int m;
            boolean uncontended = true;
            if (as == null || (m = as.length - 1) < 0 ||
                (a = as[ThreadLocalRandom.getProbe() & m]) == null ||
                !(uncontended =
                  U.compareAndSwapLong(a, CELLVALUE, v = a.value, v + x))) {
                fullAddCount(x, uncontended);
                return;
            }
            if (check <= 1)
                return;
            s = sumCount();
        }
        if (check >= 0) {
            Node<K,V>[] tab, nt; int n, sc;
            while (s >= (long)(sc = sizeCtl) && (tab = table) != null &&
                   (n = tab.length) < MAXIMUM_CAPACITY) {
                int rs = resizeStamp(n);
                if (sc < 0) {
                    if ((sc >>> RESIZE_STAMP_SHIFT) != rs || sc == rs + 1 ||
                        sc == rs + MAX_RESIZERS || (nt = nextTable) == null ||
                        transferIndex <= 0)
                        break;
                    if (U.compareAndSwapInt(this, SIZECTL, sc, sc + 1))
                        transfer(tab, nt);
                }
                else if (U.compareAndSwapInt(this, SIZECTL, sc,
                                             (rs << RESIZE_STAMP_SHIFT) + 2))
                    transfer(tab, null);
                s = sumCount();
            }
        }

数组默认长度counterCells=0；

如果在baseCount里面加入不成功，就会进入fullAddCount方法。

  U.compareAndSwapInt(this, CELLSBUSY, 0, 1)) {
                    try {
                        if (counterCells == as) {// Expand table unless stale
                            CounterCell[] rs = new CounterCell[n << 1];
                            for (int i = 0; i < n; ++i)
                                rs[i] = as[i];
                            counterCells = rs;
                        }

在此设置数组初始化，如在此多次加入还是不成功，就会扩容（前提是数组为不为空），如果数组为空，就会一直加做cas操作，
在这里插入图片描述

 if (sc < 0) {
                    if ((sc >>> RESIZE_STAMP_SHIFT) != rs || sc == rs + 1 ||
                        sc == rs + MAX_RESIZERS || (nt = nextTable) == null ||
                        transferIndex <= 0)
                        break;
                    if (U.compareAndSwapInt(this, SIZECTL, sc, sc + 1))
                        transfer(tab, nt);
                }
                else if (U.compareAndSwapInt(this, SIZECTL, sc,
                                             (rs << RESIZE_STAMP_SHIFT) + 2))
                    transfer(tab, null);
                s = sumCount();
            }

如果有线程走到这里，会直接把[rs << RESIZE_STAMP_SHIFT) + 2)]这一块的rs标记改为一个负数，上述的负数说了，不是初始化就是扩容，在此是扩容，transfer(tab, null);如果有另一个线程进入到这里，就会协助扩容。

 int n = tab.length, stride;
        if ((stride = (NCPU > 1) ? (n >>> 3) / NCPU : n) < MIN_TRANSFER_STRIDE)
            stride = MIN_TRANSFER_STRIDE; // subdivide range
        if (nextTab == null) {            // initiating
            try {
                @SuppressWarnings("unchecked")
                Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n << 1];
                nextTab = nt;
            } catch (Throwable ex) {      // try to cope with OOME
                sizeCtl = Integer.MAX_VALUE;
                return;
            }
            nextTable = nextTab;
            transferIndex = n;
        }

上述代码为多线程扩容，如果你的分出来的数组单元小于16，则最小协助扩容数组单位就为16，即一个线程至少要管理16个数组单元
如果你分出来的数组单元大于16，则就用你的给出的数组单元。

if ((stride = (NCPU > 1) ? (n >>> 3) / NCPU : n) < MIN_TRANSFER_STRIDE)

 while (advance) {
                int nextIndex, nextBound;
                if (--i >= bound || finishing)
                    advance = false;
                else if ((nextIndex = transferIndex) <= 0) {
                    i = -1;
                    advance = false;
                }
                else if (U.compareAndSwapInt
                         (this, TRANSFERINDEX, nextIndex,
                          nextBound = (nextIndex > stride ?
                                       nextIndex - stride : 0))) {
                    bound = nextBound;
                    i = nextIndex - 1;
                    advance = false;
                }
            }

上诉代码在计算确切每个线程负责多少个数组单元。
在这里插入图片描述

每次取对应数量的任务进行数据迁移，迁移任务从元素数组的末尾依稀向前迁移，并且会在已经迁移完成的结点位置设置一个fwd结点。

上图中线程1和线程2格子负责自己的迁移任务，
当线程1完成了自己的任务以后，会再去下一个任务范围的slot位置进行迁移操作，并且每个线程会将已经迁移的slot设为fwd结点。

O.Decipline

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
ConcurrentHashMap简单解释

如果有另一个线程进入到这里，就会协助扩容。该指令概念上存在 3 个参数，第一个参数【目标地址】，第二个参数【值1】，第三个参数【值2】，指令会比较【目标地址存储的内容】和【值1】是否一致，如果一致，则将【值 2】填写到【目标地址】，其语。与原HashMap不同的地方是如果该索引为空的话，则会执行cas操作，即两个线程同时进入该方法，如果线程1成功，则2不成功。在此设置数组初始化，如在此多次加入还是不成功，就会扩容（前提是数组为不为空），如果数组为空，就会一直加做cas操作，
复制链接

扫一扫