ThreadLocal源码分析

最新推荐文章于 2022-05-21 21:06:05 发布

Yuwen_forJava

最新推荐文章于 2022-05-21 21:06:05 发布

阅读量842

点赞数 2

分类专栏：后端源码文章标签： java

本文链接：https://blog.csdn.net/Yuwen_forJava/article/details/123396600

版权

后端同时被 2 个专栏收录

16 篇文章 0 订阅

订阅专栏

源码

3 篇文章 0 订阅

订阅专栏

1.ThreadLocal 是什么

Threadlocal 是 jdk 中一个非常重要的工作类。它是线程本地存储，可以保证各个线程之间的变量互不干扰。

它的数据结构：

ThreadLocalMap有点类似HashMap的结构，只是HashMap是由数组+链表实现的，而ThreadLocalMap中并没有链表结构。

注意Entry，它的key是继承自WeakReference，是弱引用类型，在 GC 时，key 有可能会被回收掉。

2.ThreadLocal 的方法

2.1 set()

点进去 set() 方法，源码如下：

public void set(T value) {
    // 获取当前线程
    Thread t = Thread.currentThread();
    // 获取当前线程的ThreadLocalMap
    ThreadLocal.ThreadLocalMap map = getMap(t);
    // 如果map存在就存储value，不存在先创建map，再设置value
    if (map != null)
        map.set(this, value);
    else
        createMap(t, value);
}

第一步就是获取当前线程，然后拿到当前线程的 ThreadLocalMap，数据就是存在这个ThreadLocalMap 中。

createMap() 的源码很简单，作用是初始化ThreadLocalMap，并添加第一个元素，元素的key为当前ThreadLocal对象，源码如下：

void createMap(Thread t, T firstValue) {
    // 初始化ThreadLocalMap，并添加第一个元素，元素的key为当前ThreadLocal对象
    t.threadLocals = new ThreadLocal.ThreadLocalMap(this, firstValue);
}

继续看初始化ThreadLocalMap的源码：

ThreadLocalMap(ThreadLocal<?> firstKey, Object firstValue) {
    // 初始化entry数组，初始大小INITIAL_CAPACITY=16
    table = new Entry[INITIAL_CAPACITY];
    // 计算ThreadLocal对象的hash，用作下标
    int i = firstKey.threadLocalHashCode & (INITIAL_CAPACITY - 1);
    // 把第一个元素的放在计算出来的下标上
    table[i] = new Entry(firstKey, firstValue);
    size = 1;
    // 设置Threshold为初始大小，Threshold是用来扩容的
    setThreshold(INITIAL_CAPACITY);
}

以上是 ThreadLocalMap 为 null 的逻辑。重点逻辑在 ThreadLocalMap 不为空时，执行的 set() 方法。源码如下：

private void set(ThreadLocal<?> key, Object value) {

    Entry[] tab = table;
    int len = tab.length;
    // 计算hash，作为数组下标
    int i = key.threadLocalHashCode & (len-1);

    // 从下标i开始遍历entry数组，直到元素为null停止遍历
    // nextIndex就是把i++，如果i等于数组长度，那么i重新设置0
    for (Entry e = tab[i];
         e != null;
         e = tab[i = nextIndex(i, len)]) {
        // 获取key，key是弱引用，可能是null
        ThreadLocal<?> k = e.get();
        // 如果k等于key（==是判断内存地址），那么把value更新一下
        if (k == key) {
            e.value = value;
            return;
        }
        // 如果key是null，那么替换过期的key
        if (k == null) {
            replaceStaleEntry(key, value, i);
            return;
        }
    }
    // 如果for循环没有进去，也就是数组下标i的元素是null，
    // 那么该下标填充一个新的entry
    tab[i] = new Entry(key, value);
    int sz = ++size;
    // 如果没有清理数据，并且数组长度大于等于threshold
    if (!cleanSomeSlots(i, sz) && sz >= threshold)
        // 判断是否需要扩容
        rehash();
}

在该方法中，先计算 hash 作为 entry 数组下标，此时：

如果该下标不存在元素，那么直接设置值。
如果该下标存在元素，并且下标元素的 key 和传递的 key 一样，那么覆盖之前的 value。
如果该下标存在元素，并且下标元素的 key 为 null，那么这个 entry 是一个过期的 entry，因为 entry 的 key 被GC回收了。这时会替换这个位置的 entry。
如果该下标存在元素，并且下标元素的 key 和传递的 key 不一样也不为 null，那么从当前下标继续向后寻找可以存在该元素的地方。

在最后，如果 cleanSomeSlots() 返回 false（没有清理到数据），并且 size 大于等于 threshold，那么会执行 rehash()，来判断是否需要扩容。

replaceStaleEntry()，这个方法会替换过期数据的逻辑，源码：

private void replaceStaleEntry(ThreadLocal<?> key, Object value,
                               int staleSlot) {
    Entry[] tab = table;
    int len = tab.length;
    Entry e;

    // 开始扫描的起点，初始值和过期元素的下标相等
    int slotToExpunge = staleSlot;
    // 从传递的下标（不包含）开始向前遍历，直到元素为null停止
    for (int i = prevIndex(staleSlot, len);
         (e = tab[i]) != null;
         i = prevIndex(i, len))
        // 目的在于确定slotToExpunge的值
        if (e.get() == null)
            slotToExpunge = i;

    // 从传递的下标（不包含）开始向后遍历，直到元素为null停止
    // 这个循环做两件事：1.确定开始清理数据的起点slotToExpunge；2.更新相同key的entry
    for (int i = nextIndex(staleSlot, len);
         (e = tab[i]) != null;
         i = nextIndex(i, len)) {
        // 获取entry的key
        ThreadLocal<?> k = e.get();

        // 遇到entry的key和传递进来key相等，就覆盖entry的value
        if (k == key) {
            // 新的value替换老的value
            e.value = value;
            // 把过期元素和当前下标的元素交换位置
            // 从这里可以看出，并不是直接替换过期entry，而是从过期entry下标向后找到一个key相同的entry
            // 然后更新key相同的entry，再把更新后entry和过期entry交换位置。
            // 自我猜测一下，这么做是想确定slotToExpunge的值，以此来更好的开展清理数据的工作
            tab[i] = tab[staleSlot];
            tab[staleSlot] = e;
            // 如果向前扫描是没有设置slotToExpunge，那么把slotToExpunge设置为i
            if (slotToExpunge == staleSlot)
                slotToExpunge = i;
            // 先从slotToExpunge开始探测式清理，然后再进行启发式清理
            cleanSomeSlots(expungeStaleEntry(slotToExpunge), len);
            // 替换过期元素结束后，结束循环
            return;
        }

        // 如果向前扫描是没有设置slotToExpunge，那么此时把遇到的第一个过期数据的下标设置为slotToExpunge
        if (k == null && slotToExpunge == staleSlot)
            slotToExpunge = i;
    }

    // 如果始终找不到过期元素，那就创建新的元素放到过期下标的位置上
    tab[staleSlot].value = null;
    tab[staleSlot] = new Entry(key, value);

    // slotToExpunge不等于staleSlot，意味着之前找到了其他过期entry，那么开始从slotToExpunge清理过期数据
    if (slotToExpunge != staleSlot)
        cleanSomeSlots(expungeStaleEntry(slotToExpunge), len);
}

仔细看 replaceStaleEntry() 会发现，在替换过期 entry 时候，不仅替换过期 entry，也把 entry 数组给清理了一遍。

清理过期 entry 的方法是 cleanSomeSlots() 和 expungeStaleEntry()，接着看下两个方法的源码：

cleanSomeSlots()：

private boolean cleanSomeSlots(int i, int n) {
    boolean removed = false;
    Entry[] tab = table;
    int len = tab.length;
    // 循环清理过期数据，启发式清理
    do {
        // 获取i后面的一个下标
        i = nextIndex(i, len);
        Entry e = tab[i];
        // 如果元素不等于null并且key已经被GC回收
        if (e != null && e.get() == null) {
            n = len;
            removed = true;
            // 把过期数据清理掉，探测式清理，从当前脏entry会再往后寻找脏entry进行清理，碰到null时结束。
            i = expungeStaleEntry(i);
        }
    }
    // n >>>= 1 说明要循环log2(n)次。
    // 这个官方说不调用n次来清除，为了效率，而且经过测试调用log(n)次清除无效的数据的效果已经很好了。
    while ( (n >>>= 1) != 0);
    return removed;
}

官方释义：启发式清理。内部逻辑是一个 while 循环，循环次数是 log2(n) 次，方法的返回值含义为是否清理过。

expungeStaleEntry()：

private int expungeStaleEntry(int staleSlot) {
    Entry[] tab = table;
    int len = tab.length;

    // 清理过期的key
    tab[staleSlot].value = null;
    tab[staleSlot] = null;
    size--;

    // 开始清理其他过期的key，探测式清理
    Entry e;
    int i;
    // 从入参staleSlot往后开始遍历清理，直到元素为null停止
    for (i = nextIndex(staleSlot, len);
         (e = tab[i]) != null;
         i = nextIndex(i, len)) {
        // 获取弱引用key
        ThreadLocal<?> k = e.get();
        // key为null那么把这个下标元素设置为null
        if (k == null) {
            e.value = null;
            tab[i] = null;
            size--;
        } else {
            // key不为null
            // 重新计算hash
            int h = k.threadLocalHashCode & (len - 1);
            // 如果新的hash不等于目前的下标（产生了hash冲突），那么就把当前下标元素设置为null
            if (h != i) {
                tab[i] = null;

                // 从h开始向后找一个为null的下标元素
                while (tab[h] != null)
                    h = nextIndex(h, len);
                // 找到了。把e设置到这个新的位置上。注意：这里的下标和key计算的hash可能并不相等
                tab[h] = e;
            }
        }
    }
    return i;
}

官方释义：探测式清理。它会把入参作为起点一直向后遍历清理过期数据，遇到null元素停止，然后把null元素的下标返回。

再次回到前面的 set()，当把过期 entry 替换后，会再次执行一次 cleanSomeSlots() 方法来清理数据，如果 cleanSomeSlots() 返回 false，那就表明没有清理到任何过期 entry。这时会判断 size 是否已经大于等于 threshold。如果上述的条件成立了，会执行 rehash()，看看是否需要进行扩容。

rehash()：

private void rehash() {
    // 再次清理一次entry数组
    expungeStaleEntries();

    // 此时如果size依旧大于等于 threshold*3/4，就进行扩容
    if (size >= threshold - threshold / 4)
        resize();
}

在方法中，第一步先整体再次清理一次过期 entry，如果清理后，size依旧大于等于 threshold*3/4，就会进行扩容。

expungeStaleEntries()：

private void expungeStaleEntries() {
    Entry[] tab = table;
    int len = tab.length;
    // 遍历整个entry数组
    for (int j = 0; j < len; j++) {
        Entry e = tab[j];
        // 如果entry不为null并且key被GC回收了，就从当前下标开始进行一次探测式清理
        if (e != null && e.get() == null)
            expungeStaleEntry(j);
    }
}

expungeStaleEntries() 会遍历整个 entry 数组，每遇到一个过期的 entry，就会从这个 entry 的位置进行一次探测式清理。

resize()：

private void resize() {
    Entry[] oldTab = table;
    int oldLen = oldTab.length;
    // 扩容为2倍
    int newLen = oldLen * 2;
    Entry[] newTab = new Entry[newLen];
    // 设置元素的次数，等于size
    int count = 0;
    // 从0开始循环遍历
    for (int j = 0; j < oldLen; ++j) {
        Entry e = oldTab[j];
        // 如果元素不等于null
        if (e != null) {
            ThreadLocal<?> k = e.get();
            // 如果key不存在，即entry过期了，把value设置为null，帮助GC回收
            if (k == null) {
                e.value = null;
            } else {
                // 计算新的hash，作为下标
                int h = k.threadLocalHashCode & (newLen - 1);
                // 如果新的下标存在元素（hash冲突），那就向后寻找一个元素为null的下标
                while (newTab[h] != null)
                    h = nextIndex(h, newLen);
                // 设置元素
                newTab[h] = e;
                count++;
            }
        }
    }
    // 设置Threshold，注意这不是简单的 set 方法，内部会乘以2/3的
    setThreshold(newLen);
    size = count;
    table = newTab;
}

resize() 是扩容方法。长度扩容为之前的两倍，会把 Threshold 重新设置。

2.2 get()

get() 会从 ThreadLocal 中读取之前 set 的数据。它会以当前 ThreadLocal 为 key，去 ThreadLocalMap 中寻找数据。

get()：

public T get() {
    // 获取当前线程的ThreadLocalMap
    Thread t = Thread.currentThread();
    ThreadLocalMap map = getMap(t);
    if (map != null) {
        // 把当前ThreadLocal作为key，获取map中的entry
        ThreadLocalMap.Entry e = map.getEntry(this);
        if (e != null) {
            // 获取entry的value，然后返回value
            T result = (T)e.value;
            return result;
        }
    }
    // map为null就返回null
    return setInitialValue();
}

第一步会获取当前线程的 ThreadLocalMap，然后把当前 ThreadLocal 作为 key 去ThreadLocalMap 中寻找数据，如果找不到就返回 null。获取数据调用的是 getEntry()。

getEntry()：

private Entry getEntry(ThreadLocal<?> key) {
    // 计算key的hash作为下标
    int i = key.threadLocalHashCode & (table.length - 1);
    Entry e = table[i];
    // 判断这个下标的entry是否存在，存在的话key是不是和目标key一致
    if (e != null && e.get() == key)
        // 条件都符合，返回这个entry
        return e;
    else
        // 从计算出的下标开始，向后寻找目标entry
        return getEntryAfterMiss(key, i, e);
}

根据 key 计算下标，如果这个下标的 entry 存在并且 entry 的 key 也没有被 GC 回收，那就命中这个 entry 返回。否则的话，调用 getEntryAfterMiss()，循环在 entry 数组中寻找目标 entry。

getEntryAfterMiss()：

private Entry getEntryAfterMiss(ThreadLocal<?> key, int i, Entry e) {
    Entry[] tab = table;
    int len = tab.length;

    // 循环遍历，直到entry为null
    while (e != null) {
        ThreadLocal<?> k = e.get();
        // key和目标key相同，直接返回这个entry
        if (k == key)
            return e;
        // k等于null，表明这个entry为过期数据，那就进行一次探测式清理
        if (k == null)
            expungeStaleEntry(i);
        else
            i = nextIndex(i, len);
        // 没有找到目标entry，向后继续寻找
        e = tab[i];
    }
    // 怎么都找不到就返回null
    return null;
}

循环遍历 entry 数组，发现过期数据就探测式清理一次数据，返回目标 entry 就命中返回。

2.3 remove()

remove()，移除数据。

public void remove() {
    // 获取当前线程的ThreadLocalMap
    ThreadLocalMap m = getMap(Thread.currentThread());
    if (m != null)
        // 把当前ThreadLocal对象作为key，在ThreadLocalMap中移除这个key
        m.remove(this);
}

第一步获取当前线程的 ThreadLocalMap，第二步把当前 ThreadLocal 对象作为 key，在ThreadLocalMap 中移除掉。

再看 m.remove(this) 的源码：

private void remove(ThreadLocal<?> key) {
    Entry[] tab = table;
    int len = tab.length;
    // 计算hash作为下标
    int i = key.threadLocalHashCode & (len-1);
    // 从i开始遍历数组，遇到null停止遍历
    for (Entry e = tab[i];
         e != null;
         e = tab[i = nextIndex(i, len)]) {
        // 如果entry的key等于入目标key，清理entry，并进行一次探测式清理
        if (e.get() == key) {
            // 会把entry的key设置为null，这时entry就会变成过期数据
            e.clear();
            expungeStaleEntry(i);
            return;
        }
    }
}

计算出 key 的 hash 作为下标，然后从i开始遍历数组，遇到null停止遍历。在遍历时，如果命中了key，那就会执行 clear() 把命中的 entry 的 key 设置为 null。这是这个 entry 就是过期数据了，然后紧接着执行 expungeStaleEntry()，会清理掉过期的 entry。

3. 相关问题

问：ThreadLocal 中 key 为什么要使用用弱引用？value使用强引用？

答：在数据使用完毕后，继续放在 ThreadLocalMap 已经没有意义，所以程序可以主动让数据在GC是被回收掉。但是直接把 entry 设置成弱引用不合理，因为 vlaue 是用户传递进来的，value 可能在其他地方存在引用。

value 不设置为弱引用是因为不清楚除了 ThreadLocal 引用之外是否还有其他的的引用

问：ThreadLocal会有内存泄露吗？

答：存在。因为 value 是强引用，不会被GC回收，而 ThreadLocal 自动清理数据是在调用 set()、get()、remove() 是进行的，如果长时间不调用 set()，get()，remove() 方法，会有内存泄露的风向。

问：ThreadLocal为什么不用链表？

答：个人觉得，key 是会被 GC 回收的，那么这 ThreadLocalMap 中的数据存在时间并不是很稳固，可能随时被GC回收。因此没必要在使用链表来优化性能了。

问：ThreadLocal什么时候扩容？

答：在 set() 时，先判断 size 是否大于 threshold，如果是的话，清理一次 entry 数组，然后再判断一次 size 是否大于 threshold3/4。如果这时依旧成立，那么进行扩容。

Yuwen_forJava

关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
ThreadLocal源码分析

1.ThreadLocal 是什么Threadlocal 是 jdk 中一个非常重要的工作类。它是线程本地存储，可以保证各个线程之间的变量互不干扰。它的数据结构：ThreadLocalMap有点类似HashMap的结构，只是HashMap是由数组+链表实现的，而ThreadLocalMap中并没有链表结构。注意Entry，它的key是继承自WeakReference，是弱引用类型，在 GC 时，key 有可能会被回收掉。2.ThreadLocal 的方法2.1 set()
复制链接

扫一扫